WTF, AI! Mit Deep Learning Audiospuren splitten

Seit ca. 1996 spiele ich aktive E-Bass. Ich habe in Coverbands angefangen und mir mühsam die Bassspuren herausgehört und somit die Songs gelernt. Manchmal war es leichter, manchmal schwerer und öfters war meine Interpretation auch falsch. Was habe ich mir gewünscht, die Spur völlig isoliert hören zu können. Seiten mit vollständig notierten Songs in Tab-Notation gab es noch nicht.

Heute haben wir es leichter. Nicht nur, dass es Tabs von allen erdenklichen Songs gibt, es gibt auch nützliche Tools, die ich mir sehnlichste gewünscht hatte, damals.

Deezer hat so ein Tool bzw. ein trainiertes neuronales Netz jüngst zur Verfügung gestellt. Damit können Songs in verschiedene Tracks gesplittet werden. Der Gesang, Drums oder auch Bass können isoliert werden. Das funktioniert ziemlich gut, egal, mit welchen Stücken ich es getestet habe. Natürlich sind die isolierten Spuren nicht lupenrein, dennoch ist es sehr beeindruckend und zeigt, was mit Deep Learning realisierbar ist. Schön ist auch die Tatsache, dass Deezer dieses Tool als Open Source veröffentlicht hat und zum experimentieren einlädt.

Photo by Samuel Ramos on Unsplash

Eliza – Oder: Alexa, wer ist deine Mutter?

Es muss irgendwann in den Achtzigerjahren gewesen sein. Ich sitze in meinem Klassenzimmer und schreibe eine Wortliste ab. Ein paar Tage zuvor habe ich aus einem Magazin ein Listing für meinen Commodore 64 abgetippt: Eliza.

Eliza war ein Chatbot. Anhand einer einfachen Analyse der getippten Worten und einem Abgleich mit einem relativ einfachen Thesaurus (jedenfalls in diesem Listing) konnte der Bot auf viele Aussagen mit einer entsprechenden Antwort kontern. Meist waren das Rückfragen.

Ich: Ich habe ein Problem mit meinen Kindern
Eliza: Erzähle mir mehr über deine Familie.

Im ersten Moment hatte man das Gefühl, die Maschine ist zum Leben erwacht! Mit der kompletten Wortliste wurde jedoch schnell klar, dass es eben nicht wirklich eine intelligente Maschine ist. So gehörte der Krieg als Mutter aller Probleme plötzlich zur Familie … Dennoch war diese erste Erfahrung für mich beeindruckend.

Eliza wurde viele Jahre zuvor, genauer im Jahr 1966, von Joseph Weizenbaum entwickelt und sollte als virtuelle Psychologin dienen. Sie hört immer zu, hinterfragt Dinge und gibt den Patienten das Gefühl, dass endlich jemand auf sie eingeht.

Betrachtet man sich die Chatbots im Hier und Heute, findet man sehr schnell viele Parallelen. Natürlich haben wir heute viel mehr an wissen, auf das ein Chatbot zugreifen kann. Dennoch ist das Grundverhalten das Gleiche. Mit Blick auf Amazon Echo und wie die Skills für die Sprachassistenten entwickelt werden, merkt man schnell, dass wir immer noch die gleichen Prinzipien verwenden. Dennoch sprechen wir von der KI und intelligenten Assistenten. Am Ende ist es doch meist nur eine Idee aus den späten sechziger Jahren.

Photo by Rock’n Roll Monkey on Unsplash

WTF, AI!

Für einen Vortrag über den Einsatz von KI in verschiedenen Bereichen, bin ich bei der Recherche auf viele Artikel, Vorträge und Reportagen gestoßen, die in mir ein WTF, AI! hervorgerufen haben. Positive, wie Negative. Daher habe ich mich dazu entschlossen, diese Fundstücke hier im Blog zum Besten geben. Anfangen möchte ich mit einem Tastatur Layout, das ein durch eine KI optimiert wurde.

Das Layout hört auf den Namen Halmak und hat die Tasten, mithilfe einer „KI“ optimal angeordnet, um effizient damit zu arbeiten. Ein Arbeitskollege von mir benutzt Dvorak als Layout, was immer wieder witzig ist, wenn jemand an seinem Rechner tippen möchte. Aber auch umgekehrt.

Klar, das klassische QWERTZ als Layout hat seinen Ursprung in den mechanischen Schreibmaschinen. Heute gibt es keine Mechanik, die verhaken kann. Damit stehen Tür und Angel offen für optimierte Layouts für minimal Bewegung der Finger. Dank einer KI wurde nun eine Verbesserung um 134 % ggü. dem normalen QWERTZ-Layout erreicht. Nikolay Nemshilov hat das wunderbar in seinem Blog dokumentiert. WTF AI!

Photo by camilo jimenez on Unsplash

Daten, Daten, Daten – Gesichter für die KI

Wer ein neuronales Netz trainieren möchte, benötigt sehr viele Daten. Das ist allgemein bekannt. Doch woher kommen die Daten? Sind es Netze, die das Verhalten einer Produktionsmaschine lernen sollen, ist es noch relativ einfach. Die Sensoren liefern Daten und der Mensch kann sie klassifizieren. Damit kann man lernen. Es existieren Unmengen von offenen Datenbanken mit Trainingsdaten für nahezu alle Arten von neuronalen Netzen. Kaggle hat einiges an Sets, damit man sein Algorithmus anlernen und validieren kann. Viele Unternehmen bieten unter dem Begriff Open Data einige Daten, wie beispielsweise die Bahn es tut.

Die Frage ist, woher diese Daten alle Stammen. Bei den Daten der Unternehmen ist es noch relativ einfach zu sagen. Trainingssets für Bilderkennung sind da schon schwerer nachvollziehbar.

Eine bekannte Datenbank für Gesichtserkennung ist MegaFace. Darin enthalten sind Millionen von Trainingsdaten und Testsets. Ein Traum – vor allem für die, die Algorithmen verbessern, neuronale Netze trainieren oder validieren möchten.

Nur, woher stammen diese Bilder?

Weiterlesen “Daten, Daten, Daten – Gesichter für die KI”

Die KI und die optische Illusion

Bilderkennung und die Interpretation des gesehenen ist derzeit eine der meistgenutzten Errungenschaften der modernen KI, oder besser gesagt: Deep Learning.

Die neuronalen Netzwerke werden in der Regel auf eine Art von Muster trainiert. Beispielsweise ein Hund. Zeige ich dem Netz ein Katzenfoto, wird es sehr wahrscheinlich sehr weit daneben liegen. Ein trainiertes Netz kann meist nur eine Aufgabe erledigen – diese aber ziemlich gut. Die Fähigkeit schnell umzuschalten und andere Dinge zu interpretieren, haben wir Menschen den Algorithmen derzeit weit voraus. Klar, es gibt Dienste, wie die Cognitive Services von Microsoft, die bereits viel mehr erkennen und interpretieren. Dennoch kann unser Gehirn besser abstrahieren, vor allem wenn es sich um optische Täuschungen, bzw. Illusionen handelt.

Google Cloud Vision ist in der Lage, die Erkennung der bekannten Illusion einer Ente und eines Hasen korrekt zu klassifizieren und eben so wankelmütig zu sein, wie unser Hirn. Das ist schon beeindruckend, zumal das Bild nicht jeweils als einzelnes erkannt wird, sondern die Rotation der Illusion korrekt zugeordnet wird. Mag relativ primitiv klingen, ist für eine KI dennoch eine ziemlich große Leistung. Wieder ein Schritt näher an der Superintelligenz.

Photo by Scott Webb on Unsplash

Stimmen. Überall Stimmen

Conversational User Interfaces sind weiterhin der letzte Schrei. Seien es Chatbots oder Voice Assistants (eigentlich auch Chatbots, nur das Eingabe- und Ausgabe-Interface unterscheidet sich).

Natürlich gesprochene Anweisungen sollen zum gewünschten Ergebnis führen. Automobilhersteller integrieren Assistenten in ihre Systeme, um die Fahrer möglichst wenig abzulenken.

Was macht Amazon?

Weiterlesen “Stimmen. Überall Stimmen”

Elektromobilität – Ja, aber…

Meine Heimat ist auf dem Land. Ich fahre täglich 30 km zur Arbeitsstätte und 30 km wieder nach Hause. Eine Strecke dauert mit dem Auto ca. 25-30 Minuten. Klar, es gibt Tage, da ist mehr Verkehr, die halten sich glücklicherweise in Grenzen. Mit den öffentlichen Verkehrsmitteln dauert eine Strecke rund 60 Minuten – von zu Hause zum Bahnhof, dann zum Zielbahnhof und schließlich noch mit dem Bus zum Büro. Somit ist für mich das Auto alternativlos. Momentan fahre ich einen Diesel, da das wirtschaftlich die beste Alternative ist. Ich würde sehr gerne ein KFZ mit Elektroantrieb für die Pendelei anschaffen, doch ergeben sich hierbei einige, nicht unerhebliche Herausforderungen.

Weiterlesen “Elektromobilität – Ja, aber…”

Deep Fakes machen Deep Problems

Wir leben in einer Zeit, in der manche Menschen es kaum noch schaffen, zwischen realen Nachrichten und so genannten Fake News zu unterscheiden. Gefühlt hat sich diese Herausforderung seit 2015 erheblich verschlimmert. Im Wahlkampf zur Präsidentschaft der USA wurden Journalisten mit „You are Fake News“ beschimpft, wenn die Meinungen oder Tatsachen nicht in das Bild passten.

In den Sozialen Medien werden Bilder zu schrecklichen Ereignissen gezeigt, die nach kurzer Recherche nachweislich nichts damit zu tun haben. Die Menschen glauben es. Sie glauben auch auf Twitter, Facebook oder anderen Kanälen geäußerte Verdächtigungen gegenüber nicht klar identifizierten Tätern. Ganz schnell wird Unruhestiftern Migrationshintergrund zugeordnet, noch bevor die Ermittlungen abgeschlossen sind. Nachrichten verbreiten sich wie Lauffeuer und niemand prüft die Echtheit. Wird eine Fake News entlarvt, folgt meist das beschwichtigende „Das haben sie falsch verstanden/Das habe ich so nicht gemeint“. Alles wieder gut.

Weiterlesen “Deep Fakes machen Deep Problems”

Hauptsache elektrisch

Meine Kinder waren ca. ein und vier Jahre alt, als ich sie mit Kinderwagen und angehängtem Buggyboard hoch zum Schloss Neuschwanstein geschoben haben. Wer schon einmal dort war, weiß, dass die Straße dort hinauf relativ steil ist. Mit einem Kind im Wagen und dem anderen auf einem eher mäßig rollendem Buggyboard, kann das schnell in Arbeit ausarten. Runter vom Berg ist nicht weniger aufregend, wenn man sich immer mal wieder vorstellt, wie weit der Wagen doch rollen möge, würde ich ihn nicht mehr festhalten.

Doch halt! Diese Ängste müssen zukünftige Generationen nicht unbedingt teilen – Dank Bosch! Denn Bosch hat den eStroller vorgestellt. Nach dem eBike und dem eScooter der scheinbar logische Schritt in Richtung einer alles und jeden elektrifizierenden Zukunft! Ein Kinderwagen mit Elektromotorunterstützung.

Weiterlesen “Hauptsache elektrisch”

Es brennt!

Der Urwald im Amazonasgebiet brennt schon länger. Interessiert hat es bisher nur sehr wenige Menschen. Ist ja klar, man ist damit beschäftigt, sich über eine 16-Jährige aufzuregen, die nicht ganz klimaneutral über den Atlantik segelt.

Wem die Tatsache des Waldbrands im Amazonasgebiet nicht egal ist, kann sich auf der Seite FIRMS (Fire Information for Resource Management System) der NASA über aktuellen Brände informieren. Nicht nur dort, auch wo anders auf dieser Erde. Das System erfasst satellitengestützt Großbrände auf dem Planeten und stellt diese auf einer Karte dar. Bei den aktuellen Bränden in Südamerika ist das derzeit leider sehr eindrucksvoll, wie man im Beitragstitelbild sehen kann.

Nein, wir haben kein Problem, bitte gehen sie weiter.