Meine Meinung

Nichts anderes als meine Meinung

John Hopkins Universität - Traue keiner Statistik welche Du nicht selbst gefälscht hast

Wenn alle den gelieferten Daten der John Hopkins Universität vertrauen, dann sollten diese aber auch sicher 100%-ig stimmen. Somit muss man sich diese Daten auch etwas genauer ansehen. Die John Hopkins Universität veröffentlicht einmal täglich deren gesammelten Daten auf GitHub. Die Daten werden in zwei unterschiedlichen Zusammenstellungen veröffentlicht. Einmal als tägliche Summen pro Region, zu finden im Verzeichnis csse_covid_19_daily_reports, und einmal als zeitlicher Verlauf, zu finden im Verzeichnis csse_covid_19_time_series. Vergleicht man die Zahlen in beiden Veröffentlichungen, dann kommt man zu den folgenden Differenzen:

John Hopkins Universität Daten Inkonsistenz per 12. 5. 2020
  Infektionen Tote Genesene
Daily Reports 4.261.955 291.964 1.493.414
Timeseries 4.261.747 291.942 1.493.417
Differenz 208 -22 -3

 

Während die Daten aus den täglichen Summen historisch vorliegen und nur bei Fehlern ein Update erhalten, hat der zeitliche Verlauf keine Vergangenheit und wird täglich neu generiert und überschrieben. Auch der angebliche gemeinsame Schlüssel, der beide Datensätze vergleichbar machen soll ist nicht unbedingt in beiden Datensätzen wirklich derselbe.

Gerade beim zeitlichen Verlauf sind die Daten der Infektionen und der Toten in Kanada nach Provinzen gegliedert, aber die Anzahl der Genesenen nur für ganz Kanada angeführt.

So ganz nebenbei treten Differenzen zum Vortag auf. Ein Hinweis oder Kommentar ob Tote wieder auferstanden sind, es sich um einen Eingabefehler von der John Hopkins Universität oder um einen Fehler bei der Behörde des jeweiligen Staates handelt, sucht man natürlich vergebens.

Infektionen - Differenzen zum Vortag
Gebiet Datum Anzahl
Alberta, Canada 2020-03-25 -1
Australian Capital Territory, Australia 2020-04-13 -1
Ecuador 2020-05-07 -1.583
Ecuador 2020-05-08 -1.480
Ecuador 2020-05-11 -50
France 2020-04-18 -17
France 2020-04-22 -2.206
France 2020-04-29 -2.512
Guizhou, China 2020-03-18 -1
Guyana 2020-03-24 -15
Honduras 2020-05-12 -20
Japan 2020-04-28 -417
Lithuania 2020-04-28 -105
Madagascar 2020-05-11 -7
Manitoba, Canada 2020-04-12 -1
Manitoba, Canada 2020-05-07 -3
Mauritius 2020-04-29 -2
New Caledonia, France 2020-04-04 -1
New South Wales, Australia 2020-05-03 -2
New Zealand 2020-04-26 -1
New Zealand 2020-05-04 -1
Newfoundland and Labrador, Canada 2020-04-22 -1
Northern Territory, Australia 2020-03-06 -1
Northern Territory, Australia 2020-05-01 -1
Ontario, Canada 2020-04-06 -7
Portugal 2020-05-02 -161
Queensland, Australia 2020-01-31 -1
Queensland, Australia 2020-02-02 -1
Queensland, Australia 2020-04-29 -1
Reunion, France 2020-05-08 -1
Saint Barthelemy, France 2020-03-09 -2
San Marino 2020-05-10 -9
Spain 2020-04-24 -10.034
Turks and Caicos Islands, United Kingdom 2020-04-02 -1
Uganda 2020-04-18 -1
Uruguay 2020-04-12 -21
Zimbabwe 2020-05-02 -6

 

Tote - Differenzen zum Vortag
Gebiet Datum Anzahl
Channel Islands, United Kingdom 2020-05-05 -1
Cyprus 2020-04-05 -2
Denmark 2020-05-12 -6
Finland 2020-04-06 -1
Germany 2020-04-11 -31
Iceland 2020-03-16 -5
Iceland 2020-03-20 -1
India 2020-03-21 -1
Kazakhstan 2020-03-21 -3
Kazakhstan 2020-04-04 -1
Luxembourg 2020-04-14 -2
Philippines 2020-03-19 -2
Prince Edward Island, Canada 2020-04-09 -1
Quebec, Canada 2020-03-22 -1
Serbia 2020-03-26 -3
Slovakia 2020-03-22 -1
Venezuela 2020-05-01 -6

 

Genesene - Differenzen zum Vortag
Gebiet Datum Anzahl
Algeria 2020-03-24 -41
Algeria 2020-03-26 -36
Andorra 2020-03-13 -1
Australian Capital Territory, Australia 2020-04-17 -1
Austria 2020-03-17 -5
Azerbaijan 2020-03-22 -1
Bahamas 2020-04-04 -1
Bahamas 2020-05-01 -1
Belarus 2020-04-05 -1
Belgium 2020-03-20 -30
Cambodia 2020-04-09 -1
Cameroon 2020-04-16 -1
Canada 2020-04-01 -268
Diamond Princess 2020-02-23 -1
Egypt 2020-03-15 -6
Estonia 2020-04-29 -4
Ethiopia 2020-03-24 -4
Ethiopia 2020-03-31 -2
Ghana 2020-04-09 -31
Guangxi, China 2020-02-12 -1
Guizhou, China 2020-02-06 -3
Hainan, China 2020-02-15 -4
Hainan, China 2020-04-02 -6
Haiti 2020-04-06 -1
Heilongjiang, China 2020-02-11 -2
Heilongjiang, China 2020-03-23 -1
Heilongjiang, China 2020-05-02 -1
Honduras 2020-04-29 -6
Hong Kong, China 2020-02-21 -1
Hubei, China 2020-04-17 -948
Iceland 2020-03-16 -8
Italy 2020-02-24 -1
Korea, South 2020-03-08 -17
Laos 2020-05-07 -1
Latvia 2020-04-03 -30
Libya 2020-04-01 -1
Malta 2020-05-02 -4
Netherlands 2020-04-21 -250
Ningxia, China 2020-02-09 -2
Northern Territory, Australia 2020-05-01 -1
Pakistan 2020-03-22 -8
Poland 2020-03-19 -12
Serbia 2020-03-26 -15
Shanghai, China 2020-04-23 -1
Shanxi, China 2020-02-03 -1
Sint Maarten, Netherlands 2020-04-05 -5
Slovakia 2020-03-26 -5
Slovakia 2020-03-31 -4
Slovakia 2020-04-06 -2
Sri Lanka 2020-03-21 -2
Sri Lanka 2020-03-24 -1
Trinidad and Tobago 2020-03-24 -1
United Kingdom 2020-04-13 -344
US 2020-05-12 -2.446
Vietnam 2020-04-24 -4
Vietnam 2020-04-28 -3
Vietnam 2020-04-30 -3
West Bank and Gaza 2020-04-06 -1
West Bank and Gaza 2020-04-28 -12

 

Meiner Meinung nach zeigen genau die hier angeführten Differenzen, dass die Datensammlung der John Hopkins Universität lediglich als Negativbeispiel einer Datenbankanwendung verwendet werden kann und nicht für einen Zweck um Entscheidungen zu treffen.

Wie wenig sich die John Hopkins Universität um die Behebung der Fehler kümmert geht auch aus den Problemmeldungen auf GitHub hervor. Von aktuell insgesamt 2.071 gemeldeten Problemen wurden bisher lediglich 765 behoben und 1.306 sind nach wie vor unbehandelt. Wohlgemerkt es handelt sich hier nur um eine Sammlung von Daten und nicht um das Dashboard Programm. Mann muss sich allerdings Fragen welchen Wert das Dashboard haben kann, welches ja auf diese Daten zugreift und als Informationsquelle nutzt.

Comments are closed