Inoffizielle Datensammlung zu Göttinger Corona-Fallzahlen
Dieses Repository enthält Corona-Fallzahlen des Landkreis Göttingen auf Gemeindeebene. Die Zahlen stammen von der Homepage der Stadt Göttingen wo sie seit April 2020 veröffentlicht werden. Darüber hinaus enthalt das Repository Hilfsmittel zum Herunterladen, Visualisieren und Analysieren der Daten, insbesondere:
Sowie
- Fallzahlen.ipynb ist ein Jupyter Notebook mit einigen Analysen. Das Notebook kann hier mittels Binder im Browser geöffnet werden. Verbesserungsvorschläge sind willkommen!
Für die Datensammlung und -Extraktion wird benötigt:
- Bash
- pup
- jq
Für die Datenanalyse wird benötigt:
- Juypter Notebook mit Pandas (ggf. installierbar mit
pip3 install jupyter pandas matplotlib
)
Da der RSS-Feed der Homepage der Stadt Göttingen nicht verlässlich ist werden einfach alle Artikel (ab Artikel-ID 3064 vom 4.3.2020) heruntergeladen.
for i in {3064..4310}; do ./download $i; sleep 1; done
Zur Übersicht kann erstmal eine Liste aller Artikel mit Datum, URL und Titel erstellt werden: Anschließend werden aus den Artikeln Datum, Titel und Inhalt extrahiert:
make artikel.tsv
Aus den Titel lässt sich schon oft die Zahl von Infizierten ablesen. Für die genauen Zahlen nach Gemeinde müssen die Artikelinhalte analysiert werden:
make fallzahlen.tsv
Das Skript update
ermittelt automatisch die letzte Artikel-ID, läd alle fehlenden Artikel herunter und erweitert die Datei fallzahlen.tsv
. Mit dem Argument commit
wird die Aktualisierung gleich im git-Repository committed:
./update commit
Webseite hot-reloading unter http://localhost:37073 bereitstellen:
npm i
npm run dev
Die Layout-Dateien sind um Wesentlichen views/*.html
und docs/*.css
.
Use as you like and stay safe (Unlicense)!