Wenn alle den gelieferten Daten der John Hopkins Universität vertrauen, dann sollten diese aber auch sicher 100%-ig stimmen. Somit muss man sich diese Daten auch etwas genauer ansehen. Die John Hopkins Universität veröffentlicht einmal täglich deren gesammelten Daten auf GitHub. Die Daten werden in zwei unterschiedlichen Zusammenstellungen veröffentlicht. Einmal als tägliche Summen pro Region, zu finden im Verzeichnis csse_covid_19_daily_reports, und einmal als zeitlicher Verlauf, zu finden im Verzeichnis csse_covid_19_time_series. Vergleicht man die Zahlen in beiden Veröffentlichungen, dann kommt man zu den folgenden Differenzen:
John Hopkins Universität Daten Inkonsistenz per 12. 5. 2020 |
|
Infektionen |
Tote |
Genesene |
Daily Reports |
4.261.955 |
291.964 |
1.493.414 |
Timeseries |
4.261.747 |
291.942 |
1.493.417 |
Differenz |
208 |
-22 |
-3 |
Während die Daten aus den täglichen Summen historisch vorliegen und nur bei Fehlern ein Update erhalten, hat der zeitliche Verlauf keine Vergangenheit und wird täglich neu generiert und überschrieben. Auch der angebliche gemeinsame Schlüssel, der beide Datensätze vergleichbar machen soll ist nicht unbedingt in beiden Datensätzen wirklich derselbe.
Gerade beim zeitlichen Verlauf sind die Daten der Infektionen und der Toten in Kanada nach Provinzen gegliedert, aber die Anzahl der Genesenen nur für ganz Kanada angeführt.
So ganz nebenbei treten Differenzen zum Vortag auf. Ein Hinweis oder Kommentar ob Tote wieder auferstanden sind, es sich um einen Eingabefehler von der John Hopkins Universität oder um einen Fehler bei der Behörde des jeweiligen Staates handelt, sucht man natürlich vergebens.
Infektionen - Differenzen zum Vortag |
Gebiet |
Datum |
Anzahl |
Alberta, Canada |
2020-03-25 |
-1 |
Australian Capital Territory, Australia |
2020-04-13 |
-1 |
Ecuador |
2020-05-07 |
-1.583 |
Ecuador |
2020-05-08 |
-1.480 |
Ecuador |
2020-05-11 |
-50 |
France |
2020-04-18 |
-17 |
France |
2020-04-22 |
-2.206 |
France |
2020-04-29 |
-2.512 |
Guizhou, China |
2020-03-18 |
-1 |
Guyana |
2020-03-24 |
-15 |
Honduras |
2020-05-12 |
-20 |
Japan |
2020-04-28 |
-417 |
Lithuania |
2020-04-28 |
-105 |
Madagascar |
2020-05-11 |
-7 |
Manitoba, Canada |
2020-04-12 |
-1 |
Manitoba, Canada |
2020-05-07 |
-3 |
Mauritius |
2020-04-29 |
-2 |
New Caledonia, France |
2020-04-04 |
-1 |
New South Wales, Australia |
2020-05-03 |
-2 |
New Zealand |
2020-04-26 |
-1 |
New Zealand |
2020-05-04 |
-1 |
Newfoundland and Labrador, Canada |
2020-04-22 |
-1 |
Northern Territory, Australia |
2020-03-06 |
-1 |
Northern Territory, Australia |
2020-05-01 |
-1 |
Ontario, Canada |
2020-04-06 |
-7 |
Portugal |
2020-05-02 |
-161 |
Queensland, Australia |
2020-01-31 |
-1 |
Queensland, Australia |
2020-02-02 |
-1 |
Queensland, Australia |
2020-04-29 |
-1 |
Reunion, France |
2020-05-08 |
-1 |
Saint Barthelemy, France |
2020-03-09 |
-2 |
San Marino |
2020-05-10 |
-9 |
Spain |
2020-04-24 |
-10.034 |
Turks and Caicos Islands, United Kingdom |
2020-04-02 |
-1 |
Uganda |
2020-04-18 |
-1 |
Uruguay |
2020-04-12 |
-21 |
Zimbabwe |
2020-05-02 |
-6 |
Tote - Differenzen zum Vortag |
Gebiet |
Datum |
Anzahl |
Channel Islands, United Kingdom |
2020-05-05 |
-1 |
Cyprus |
2020-04-05 |
-2 |
Denmark |
2020-05-12 |
-6 |
Finland |
2020-04-06 |
-1 |
Germany |
2020-04-11 |
-31 |
Iceland |
2020-03-16 |
-5 |
Iceland |
2020-03-20 |
-1 |
India |
2020-03-21 |
-1 |
Kazakhstan |
2020-03-21 |
-3 |
Kazakhstan |
2020-04-04 |
-1 |
Luxembourg |
2020-04-14 |
-2 |
Philippines |
2020-03-19 |
-2 |
Prince Edward Island, Canada |
2020-04-09 |
-1 |
Quebec, Canada |
2020-03-22 |
-1 |
Serbia |
2020-03-26 |
-3 |
Slovakia |
2020-03-22 |
-1 |
Venezuela |
2020-05-01 |
-6 |
Genesene - Differenzen zum Vortag |
Gebiet |
Datum |
Anzahl |
Algeria |
2020-03-24 |
-41 |
Algeria |
2020-03-26 |
-36 |
Andorra |
2020-03-13 |
-1 |
Australian Capital Territory, Australia |
2020-04-17 |
-1 |
Austria |
2020-03-17 |
-5 |
Azerbaijan |
2020-03-22 |
-1 |
Bahamas |
2020-04-04 |
-1 |
Bahamas |
2020-05-01 |
-1 |
Belarus |
2020-04-05 |
-1 |
Belgium |
2020-03-20 |
-30 |
Cambodia |
2020-04-09 |
-1 |
Cameroon |
2020-04-16 |
-1 |
Canada |
2020-04-01 |
-268 |
Diamond Princess |
2020-02-23 |
-1 |
Egypt |
2020-03-15 |
-6 |
Estonia |
2020-04-29 |
-4 |
Ethiopia |
2020-03-24 |
-4 |
Ethiopia |
2020-03-31 |
-2 |
Ghana |
2020-04-09 |
-31 |
Guangxi, China |
2020-02-12 |
-1 |
Guizhou, China |
2020-02-06 |
-3 |
Hainan, China |
2020-02-15 |
-4 |
Hainan, China |
2020-04-02 |
-6 |
Haiti |
2020-04-06 |
-1 |
Heilongjiang, China |
2020-02-11 |
-2 |
Heilongjiang, China |
2020-03-23 |
-1 |
Heilongjiang, China |
2020-05-02 |
-1 |
Honduras |
2020-04-29 |
-6 |
Hong Kong, China |
2020-02-21 |
-1 |
Hubei, China |
2020-04-17 |
-948 |
Iceland |
2020-03-16 |
-8 |
Italy |
2020-02-24 |
-1 |
Korea, South |
2020-03-08 |
-17 |
Laos |
2020-05-07 |
-1 |
Latvia |
2020-04-03 |
-30 |
Libya |
2020-04-01 |
-1 |
Malta |
2020-05-02 |
-4 |
Netherlands |
2020-04-21 |
-250 |
Ningxia, China |
2020-02-09 |
-2 |
Northern Territory, Australia |
2020-05-01 |
-1 |
Pakistan |
2020-03-22 |
-8 |
Poland |
2020-03-19 |
-12 |
Serbia |
2020-03-26 |
-15 |
Shanghai, China |
2020-04-23 |
-1 |
Shanxi, China |
2020-02-03 |
-1 |
Sint Maarten, Netherlands |
2020-04-05 |
-5 |
Slovakia |
2020-03-26 |
-5 |
Slovakia |
2020-03-31 |
-4 |
Slovakia |
2020-04-06 |
-2 |
Sri Lanka |
2020-03-21 |
-2 |
Sri Lanka |
2020-03-24 |
-1 |
Trinidad and Tobago |
2020-03-24 |
-1 |
United Kingdom |
2020-04-13 |
-344 |
US |
2020-05-12 |
-2.446 |
Vietnam |
2020-04-24 |
-4 |
Vietnam |
2020-04-28 |
-3 |
Vietnam |
2020-04-30 |
-3 |
West Bank and Gaza |
2020-04-06 |
-1 |
West Bank and Gaza |
2020-04-28 |
-12 |
Meiner Meinung nach zeigen genau die hier angeführten Differenzen, dass die Datensammlung der John Hopkins Universität lediglich als Negativbeispiel einer Datenbankanwendung verwendet werden kann und nicht für einen Zweck um Entscheidungen zu treffen.
Wie wenig sich die John Hopkins Universität um die Behebung der Fehler kümmert geht auch aus den Problemmeldungen auf GitHub hervor. Von aktuell insgesamt 2.071 gemeldeten Problemen wurden bisher lediglich 765 behoben und 1.306 sind nach wie vor unbehandelt. Wohlgemerkt es handelt sich hier nur um eine Sammlung von Daten und nicht um das Dashboard Programm. Mann muss sich allerdings Fragen welchen Wert das Dashboard haben kann, welches ja auf diese Daten zugreift und als Informationsquelle nutzt.