Daten, Daten, Daten – Gesichter für die KI

Wer ein neuronales Netz trainieren möchte, benötigt sehr viele Daten. Das ist allgemein bekannt. Doch woher kommen die Daten? Sind es Netze, die das Verhalten einer Produktionsmaschine lernen sollen, ist es noch relativ einfach. Die Sensoren liefern Daten und der Mensch kann sie klassifizieren. Damit kann man lernen. Es existieren Unmengen von offenen Datenbanken mit Trainingsdaten für nahezu alle Arten von neuronalen Netzen. Kaggle hat einiges an Sets, damit man sein Algorithmus anlernen und validieren kann. Viele Unternehmen bieten unter dem Begriff Open Data einige Daten, wie beispielsweise die Bahn es tut.

Die Frage ist, woher diese Daten alle Stammen. Bei den Daten der Unternehmen ist es noch relativ einfach zu sagen. Trainingssets für Bilderkennung sind da schon schwerer nachvollziehbar.

Eine bekannte Datenbank für Gesichtserkennung ist MegaFace. Darin enthalten sind Millionen von Trainingsdaten und Testsets. Ein Traum – vor allem für die, die Algorithmen verbessern, neuronale Netze trainieren oder validieren möchten.

Nur, woher stammen diese Bilder?

Weiterlesen “Daten, Daten, Daten – Gesichter für die KI”