zurück zum Artikel

KI mit dem Browser ausprobieren

| Jo Bager

Das beeindruckende Potenzial von Machine Learning lÀsst sich erahnen, sobald die KI-Technik kreativ wird. Probieren Sie es an den Beispielen im Artikel aus.

Man muss sich immer wieder vergegenwĂ€rtigen, wieviele Anwendungen Machine Learning in welch kurzer Zeit substanziell verbessert oder komplett neu ermöglicht hat, denn beim Einsatz der Technik ĂŒben sich viele Unternehmen in Understatement. Siri erkennt gesprochene Sprache und Facebook erkennt Gesichter, ohne dass Apple und Co. groß auf die dahinterliegende Technik hinweisen wĂŒrden.

Kann der Anwender bei diesen Beispielen noch konkret nachvollziehen, dass eine neue, ziemliche mÀchtige Technik am Werk ist, arbeitet Machine Learning an anderen Stellen völlig unsichtbar als Infrastrukturangebot im Hintergrund. Ridesharing-Anbieter wie Uber oder Lyft etwa steuern ihre Flotte durch KI-Systeme. Netflix berechnet seine Empfehlungen aus den Nutzungshistorien des einzelnen Anwenders und denen der gesamten Nutzerschaft.

Mehr Infos

Ausgerechnet der Uralt-Dienst E-Mail war einer der Vorreiter fĂŒr den Siegeszug von lernenden Verfahren auf dem Desktop. Ältere Semester werden sich noch erinnern, dass man vor ein paar Jahren „intelligente“ Spam-Filter noch von Hand trainieren musste, indem man ihnen explizit beibrachte, welche E-Mail Spam ist und welche nicht. Auch heute noch sortieren lernende Spam-Filter Werbemails aus, allerdings in aller Regel unsichtbar beim Provider, oft ohne dass der Anwender eingreifen muss.

KI erobert sehr schnell neue, auch kritische Lebensbereiche. So kann man bei Robo-Tradern seine Ersparnisse von Software-Robotern verwalten lassen. Der Weg zu einem „Doktor KI“ ist zwar noch weit. Mit der Smartphone-App Ada erhĂ€lt man aber schon einen ersten Eindruck. Die App hilft beim Einordnen gesundheitlicher Symptome. Bei einzelnen Aufgaben haben sich KI-Anwendungen zudem bereits als zuverlĂ€ssiger gezeigt als spezialisierte Ärzte, etwa bei der Diagnose bestimmter Krebsformen. Beim Predictive Policing schließlich steuert eine KI, wo die Polizei verstĂ€rkt Streife fĂ€hrt.

Die Liste ließe sich beliebig mit Beispielen aus den verschiedensten Bereichen erweitern. In c't 21/2019 haben wir beispielsweise eine KI-gesteuerte ZahnbĂŒrste getestet [5]. Wir beschrĂ€nken uns in der Folge auf eine Auswahl von Beispielen aus kreativen Feldern, weil sie am besten erlebbar machen, was KI alles kann. Viele der Beispiele können Sie im Browser gleich selbst ausprobieren.

Die Königsdisziplin des Deep Learning ist die Mustererkennung. Und dafĂŒr gibt es reichlich Beispiele im Netz, mit denen Jedermann experimentieren kann. FĂŒr How old do I look [6]? etwa hat Microsoft ein neuronales Netz darauf programmiert, zu schĂ€tzen, wie alt Personen auf Bildern sein mögen. Sie können die Anwendung mit vorgegebenen Fotos ausprobieren oder ein eigenes hochladen. Die Ergebnisse sind nicht immer perfekt, aber es macht Spaß, sich mit Freunden schĂ€tzen zu lassen.

KI kann nicht nur das Alter veranschlagen, sondern auch Emotionen erkennen. Auch dafĂŒr gibt es eine Demo-Website von Microsoft. Die KI liefert zu einem hochgeladenen Bild einen kompletten Datensatz zurĂŒck, aus dem sich unter anderem ablesen lĂ€sst, welche Haarfarbe und welches Geschlecht das System erkannt hat.

ZusĂ€tzlich gibt die KI fĂŒr die Emotionen anger (Zorn), contempt (Verachtung), disgust (Ekel), fear (Angst), happiness (Freude), neutral, sadness (Traurigkeit) und surprise (Überraschtheit) einen Wert zwischen 0 und 1 aus, die einer EinschĂ€tzung entsprechen, wieviel von der jeweiligen Emotion zu sehen ist: Ein Wert nahe Null bedeutet wenig, ein Wert nahe 1 viel. Auch die Emotionserkennung [7] können Sie mit eigenen Bildern ausprobieren.

Bei IBM Watson [8] können Sie sogar einen allgemeinen Erkenner auf Ihre Bilder loslassen. Er versucht zum Beispiel zu bestimmen, was eine abgebildete Person macht, ob das Bild draußen oder drinnen aufgenommen wurde und um was fĂŒr eine Gegend oder einen Raum es sich handeln könnte. Eine Peperonipizza erkannte er in unseren Experimenten nicht nur allgemein als Pizza, sondern nannte auch den genauen Typ.

Bei Googles Quick, Draw! [9] testet man spielerisch die Erkennungsleistung eines neuronalen Netzwerks – und trainiert es zugleich. Der Besucher erhĂ€lt die Aufgabe, mit der Maus nacheinander sechs kleine Skizzen von Objekten anzufertigen, die die Website zufĂ€llig vorgibt. Nur jeweils 20 Sekunden Zeit erhĂ€lt er dafĂŒr.

Die KI versucht dabei, zu erraten, was das Gekritzel sein soll. Ist sie sich hinreichend sicher, bricht sie auch schon vor den zwanzig Sekunden ab. Nebenbei fĂŒllt der Besucher mit diesem Spiel die öffentlich zugĂ€ngliche weltweit grĂ¶ĂŸte Datenbank fĂŒr Zeichnungen.

KI kann auch selber malen [10]. Das können Sie bei deepart.io [11] oder Dreamscope [12] selbst ausprobieren: Mit einer Technik namens Stiltransfer ĂŒbertragen diese Sites die grafische Machart eines Bildes auf ein anderes. So lĂ€sst sich zum Beispiel einem beliebigen Portrait oder Landschaftsbild ein Look geben, als sei es von Vincent Van Gogh gemalt worden. Stiltransfer ist mittlerweile schon im Mainstream angekommen: Es gibt etliche Apps fĂŒr iOS und Android.

Auf die Spitze bei der KreativitĂ€t treibt es derzeit Nvidia. Der Grafikkartenhersteller hat sein neuronales Netz Gaugan [13] darauf trainiert, aus sehr groben Skizzen annĂ€hernd fotorealistische Landschaften zu generieren. In einem interaktiven Editor malt der Besucher nur die groben Umrisse einer Landschaft – nach einem Klick kreiert Gaugan sie in FotoqualitĂ€t.

Aus ein paar mit der Maus hindilletierten Punkten, Linien und FlÀchen zaubert Adobes KI Gaugan annÀhernd fotorealistische Landschaften.

Aus ein paar mit der Maus hindilletierten Punkten, Linien und FlÀchen zaubert Adobes KI Gaugan annÀhernd fotorealistische Landschaften.

Die kreativen FĂ€higkeiten von KI haben auch eine potenziell gefĂ€hrliche Seite. Die zeigt sich auf der Website, die Which Face is real [14] fragt, also „Welches Gesicht ist echt?“ Zwei vermeintliche Fotos von Gesichtern stellt es zur Wahl, von denen eines einen echten Menschen zeigt. Das andere dagegen gibt es nicht in der RealitĂ€t.

Ein neuronales Netzwerk hat es geschaffen: Ein bemerkenswertes Beispiel fĂŒr die Kunstfertigkeit maschinellen Lernens, denn es ist fĂŒr den Besucher wirklich nicht immer einfach, das falsche Gesicht zu identifizieren. Gleichzeitig soll die Website Besucher auch fĂŒr die Missbrauchsmöglichkeiten von KI sensibilisieren und zeigen, wie einfach damit gefĂ€lschte IdentitĂ€ten erzeugt werden können.

FĂ€lschen lassen sich nicht nur statische Bilder. Wer Fake News verbreiten will, kann mittlerweile per KI Politikern in Ton und Bewegtbild falsche Aussagen in den Mund legen – Deep Fake werden solche fabrizierten Videodateien genannt. Die Ergebnisse sind fĂŒr Unbedarfte oft nicht erkennbar. GlĂŒcklicherweise gibt es (noch) keinen einfach zu bedienenden Editor fĂŒr Deep Fakes. Es gibt mittlerweile allerdings Software, die Deep Fakes in Echtzeit ermöglicht [15]. Gleichzeitig wird es immer schwieriger, ein Deep Fake-Video als solches zu erkennen [16].

Wie von einem Menschen geschriebene Fußball-Spielberichte: kein Problem fĂŒr eine KI.

Wie von einem Menschen geschriebene Fußball-Spielberichte: kein Problem fĂŒr eine KI.

Einige KI-Anwendungen können sehr gut texten. Etliche Medien veröffentlichen zum Beispiel automatisch generierte Artikel, die sich von denen eines Redakteurs nicht mehr unterscheiden lassen – etwa bei Wettervorhersagen, Börsennotizen und bei Sportberichten.

Davon kann man sich zum Beispiel bei Retresco [17] einen Eindruck verschaffen. Der Anbieter stellt Textgeneratoren fĂŒr verschiedene Websites bereit. Auf seiner Homepage demonstriert er die Möglichkeiten am Beispiel von Fußball-Spielberichten fĂŒr die erste Liga. Haben Sie sich einen Spielbericht anfertigen lassen, probieren Sie den Button „Neu generieren“ aus: Das Programm spuckt zum selben Spiel eine völlig neue Zusammenfassung aus.

Mensch oder Maschine: Das ist die Frage bei Bot or not [18]. Die Website prĂ€sentiert ein Gedicht und die Aufgabe fĂŒr den Besucher lautet, zu erraten, ob das Werk von einem Menschen oder einer Software verfasst wurde. Der KI-Ingenieur Adam King hat mit Talk to Transformer [19] eine KI veröffentlicht, die mehrere AbsĂ€tze lange englischsprachige Artikel generiert, wenn man ihr ein oder zwei SĂ€tze vorgibt.

Zum 334. Geburtstag des Komponisten Johann Sebastian Bach am 21. MĂ€rz 2019 hat sich Google ein ganz besonderes Doodle einfallen lassen. Mit dieser auch heute noch abrufbaren interaktiven Anwendung namens Zu Ehren von Johann Sebastian Bach [20] „komponieren“ Besucher Melodien im Stile des Meisters. Sie geben dabei die Noten fĂŒr eine Stimme vor. Die Anwendung harmonisiert sie mit weiteren Stimmen im Stile Bachs. Dazu wurde die Anwendung mit mehr als 300 Werken trainiert.

Mit Googles Doodle zum Geburtstag von Johann Sebastian gibt der Nutzer nur die (schwarzen) Noten fĂŒr die erste Stimme vor; die restlichen drei stammen aus einer KI.

Mit Googles Doodle zum Geburtstag von Johann Sebastian gibt der Nutzer nur die (schwarzen) Noten fĂŒr die erste Stimme vor; die restlichen drei stammen aus einer KI.

FĂŒr ein weiteres Experiment, The Infinite Drum Machine [21], hat Google einen Drum Sequencer aus tausenden von AlltagsgerĂ€uschen gebaut. Diese GerĂ€usche sind in einer riesigen zweidimensionalen Punktewolke angeordnet, aus der sich der Musiker bedient. Als Besonderheit kommt dabei nicht wie bei fast allen anderen aktuellen KI-Anwendungen Deep Learning zum Einsatz; die Matrix ist statt dessen mit der Methode „t-Distributed Stochastic Neighbor Embedding (t-SNE)“ nach akustischer Ähnlichkeit sortiert. Ein anderes sehr witziges Experiment, Giorgio Cam [22], versucht, Objekte mit der PC-Kamera zu erkennen und macht daraus dann Musik mit Schnipseln aus Giorgio Moroders Werken.

Der Algorithmus von Mubert [23], einer fĂŒr Android und iOS verfĂŒgbaren App, erzeugt endlose Musik-Streams bestimmter Genres wie House oder Ambient oder fĂŒr bestimmte Gelegenheiten (work, study, etc.). Der Player auf der Website hat zwar einen im Vergleich zur App eingeschrĂ€nkten Funktionsumfang, gibt aber einen guten Eindruck von Muberts Potenzial.

KI spielt heute auch bei den Musik-Profis eine immer wichtigere Rolle. So können KI-Filter auf Knopfdruck ein Schlagzeug aus einem Gesamtmix entfernen. Mit Yamahas Software-Synthesizer Vocaloid kann man sogar kĂŒnstlichen Gesang erzeugen, bei dem man Stimme, Text, Melodie und Betonung beliebig anpassen kann [24]. Mittlerweile gibt es etliche StĂŒcke, bei deren Entstehung KI eine Rolle gespielt hat. Kostproben gefĂ€llig? Unsere Kollegin Jennifer Lepies aus der Redaktion der Technology Review hat eine Reihe von Tracks und Alben zusammengestellt [25].

Schach, Go, Super Mario, Dota 2, StarCraft 2, Quake 3, zuletzt sogar Poker: Bei vielen Brett- und Computerspielen brillieren KI-Anwendungen und stechen menschliche Gegner aus [26]. Das hat auch damit zu tun, dass Spiele oft ein sehr kleines, ĂŒberschaubares Regelwerk haben, das sich Spiele-KIs mitunter nur durch Beobachtung selbst beibringen konnten. Ausprobieren lassen sich die meisten der siegreichen KI-Anwendungen nicht. Allerdings gibt es etliche Videos der jeweiligen Siege, darunter ein Video von der Partie zwischen der KI AlphaGo und dem weltbesten Go-Spieler Lee Sedol [27].

Sollten Sie von den hier vorgestellten Beispielen noch nicht genug haben: Schauen Sie auf den Websites der großen Tech-Unternehmen um, wie beispielsweise bei Microsofts KI-Lab [28] oder IBM Research [29]. Bei Google finden Sie Dutzende weitere KI-Experimente [30].


Dieser Artikel stammt aus c't 21/2019.
(jo [31])


URL dieses Artikels:
https://www.heise.de/-4537812

Links in diesem Artikel:
[1] https://www.heise.de/select/ct/2019/21/1570804353784999
[2] https://heise.de/-4537812
[3] https://www.heise.de/ct/artikel/KI-Lernangebote-fuer-Einsteiger-und-Fortgeschrittene-4537877.html
[4] https://www.heise.de/select/ct/2019/21/1570802553912690
[5] https://www.heise.de/select/ct/2019/21/1570544022075522
[6] https://www.how-old.net/
[7] https://azure.microsoft.com/de-de/services/cognitive-services/face/
[8] https://www.ibm.com/watson/services/visual-recognition/demo/#demo
[9] https://quickdraw.withgoogle.com/#
[10] https://www.heise.de/select/ct/2017/11/1495733265623730
[11] https://deepart.io/
[12] https://dreamscopeapp.com/
[13] http://nvidia-research-mingyuliu.com/gaugan
[14] http://www.whichfaceisreal.com/
[15] https://www.heise.de/developer/meldung/Software-ermoeglicht-Deep-Fakes-in-Echtzeit-4500193.html
[16] https://www.youtube.com/watch?v=gLoI9hAX9dw
[17] https://www.retresco.de/lexikon/automatische-texterstellung/
[18] http://botpoet.com/
[19] https://talktotransformer.com/
[20] https://www.google.com/doodles/celebrating-johann-sebastian-bach
[21] https://experiments.withgoogle.com/ai/drum-machine/view/
[22] https://experiments.withgoogle.com/ai/giorgio-cam/view/
[23] https://mubert.com/
[24] https://www.heise.de/select/ct/2019/17/1565965687753203
[25] https://www.heise.de/tr/blog/artikel/KI-Hitparade-4413540.html
[26] https://www.heise.de/newsticker/meldung/Starcraft-2-DeepMind-KI-schlaegt-Profi-Spieler-4288223.html
[27] https://www.youtube.com/watch?v=ptN_-wxMHxI
[28] https://www.microsoft.com/en-us/ai/ai-lab-experiments?activetab=pivot1%3Aprimaryr3
[29] https://www.research.ibm.com/artificial-intelligence/experiments/try-our-tech/
[30] https://experiments.withgoogle.com/collection/ai
[31] mailto:jo@ct.de