sandtner.net

Menü Schließen

Schlagwort: Daten

My Corona – COVID-19 Update

Im letzten Post habe ich mich mit den Daten zu dem Corona/Covid-19-Virus beschäftigt. Dort habe ich ein paar Diagramme erstellt und (subjektive) Rückschlüsse daraus gezogen. Ein Kollege fragte mich, in Bezug auf den Vergleich zwischen den bestätigten Infektionen zwischen Deutschland und China, wie sich die Kurven im Verhältnis zur jeweiligen Bevölkerung verhalten.

Voilà, so schauts’ aus:

Diagramm: Bestätigte Infektionen in Bezug zur Bevölkerung.

Man sieht sehr schön: In Deutschland stehen wir am Anfang eines exponentiellen Anstiegs. In Bezug auf die Gesamtbevölkerung herrschen bei uns noch nicht die gleichen Herausforderungen, wie es in China ist und war.

Auf Hinweis des gleichen Kollegen habe ich auch die Infizierten, Geheilten und Toten gegenüber gestellt. Und siehe da: Wir haben stand 05.03.2020 mehr geheilte als bestätigt infizierte.

Diagramm: Vergleich der Infektionen, Heilungen und Toten

Es bleibt abzuwarten, wie sich das Virus in Europa und Amerika entwickelt, dennoch finde ich das diese positive Entwicklung auch mal erwähnt werden muss!

Coronavirus – oder: COVID-19 übernehmen sie!

Coronavirus? COVID-19? Nichts bestimmt die News mehr als dieser Virus, gegen den bisher keine Impfung und Heilmittel bekannt ist. Trotzdem sterben daran nur die Wenigsten. Daten dazu habe ich mir mal angeschaut und für mich interpretiert.

Da ich weder über eine geeignete medizinische Ausbildung, noch in der Forschung beschäftigt bin, habe ich die Daten rein aus persönlichem Interessen analysiert und interpretiert. Alle Interpretationen sind rein subjektiv und spiegeln meine Beobachtungen wider.

Vor allem diente mir dieser Case als Übung. Zum einen, um mit Pandas und Matplotlib zu arbeiten. Zum Anderen konnte ich die Analyse von Daten inkl. der Interpretation von Daten üben. Ich stelle in dem Post meist die Zahlen aus China und Deutschland in Bezug. Hintergrund ist, dass der Virus in China eine ganz andere Verbreitung hat, als in Deutschland. Hierbei kann man einige (subjektive) Rückschlüsse ziehen.

Die Daten habe ich aus dem Github-Repository von JHU CSSE entnommen. Dort findet man zum einen eine Gesamtübersicht über alle registrierten Fälle, als auch eine zeitliche Betrachtung der Fälle, jeweils aufgeteilt in Länder und, falls vorhanden, in deren Regionen. Die Daten dort sind immer Tagesaktuell und werden aktuell gehalten. Meine Analyse basiert auf den Daten vom 02.03.2020.

Weiterlesen

Daten, Daten, Daten – Gesichter für die KI

Wer ein neuronales Netz trainieren möchte, benötigt sehr viele Daten. Das ist allgemein bekannt. Doch woher kommen die Daten? Sind es Netze, die das Verhalten einer Produktionsmaschine lernen sollen, ist es noch relativ einfach. Die Sensoren liefern Daten und der Mensch kann sie klassifizieren. Damit kann man lernen. Es existieren Unmengen von offenen Datenbanken mit Trainingsdaten für nahezu alle Arten von neuronalen Netzen. Kaggle hat einiges an Sets, damit man sein Algorithmus anlernen und validieren kann. Viele Unternehmen bieten unter dem Begriff Open Data einige Daten, wie beispielsweise die Bahn es tut.

Die Frage ist, woher diese Daten alle Stammen. Bei den Daten der Unternehmen ist es noch relativ einfach zu sagen. Trainingssets für Bilderkennung sind da schon schwerer nachvollziehbar.

Eine bekannte Datenbank für Gesichtserkennung ist MegaFace. Darin enthalten sind Millionen von Trainingsdaten und Testsets. Ein Traum – vor allem für die, die Algorithmen verbessern, neuronale Netze trainieren oder validieren möchten.

Nur, woher stammen diese Bilder?

Weiterlesen

© 2020 sandtner.net. Alle Rechte vorbehalten.

Thema von Anders Norén.