Neues aus der KI-Wundertüte (Teil 2)
Heute möchte ich Ihnen weitere Beispiele einer (demnächst) mehr oder weniger praktisch einsetzbarer künstlichen Intelligenz vorstellen.
„Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“ Woher diese Aussage stammt, haben Sie an dieser Stelle vorletzte Woche erfahren (Neues aus der KI-Wundertüte: Bildbearbeitungs-Magie (Einführung und Teil 1)).
RealityScan-App von Epic: iPhone-Fotos in hochauflösende 3D-Modelle konvertieren
3D-Photogrammetry ist nichts Neues. Die haben wir schon vor Jahren im Heft vorgestellt und im App-Store gibt es Dutzende Apps, mit denen man aus Fotos oder durch Abfilmen 3D-Modelle erzeugen kann. Neu bei RealityScan ist die erzielbare Qualität der Ergebnisse. Leider habe ich es nicht mehr in die auf 10000 Teilnehmer beschränkte Open-Beta geschafft, sodass ich das nicht persönlich bestätigen kann. Aber die Vorschau sieht klasse aus:
Youtube:
Diese App und Photogrammetrie haben nun noch nichts mit KI zu tun. Aber damit kommen wir schon zum nächsten Evolutionsschritt – NVidia Instant NeRF:
NVIDIA Instant NeRF: 3D-Modelle aus 2D-Foto(s) ableiten
NeRFs nutzen neurale Netzwerke, um realistische 3D-Szenen aus einer Auswahl von 2D-Bildern abzuleiten. Anders als bei der Photogrammetry braucht man dabei nicht mehr Fotos von jeder Objektstelle, denn die KI ergänzt fehlende Bereiche. Hier das Ganze im Video:
Youtube:
Frisur-Übertragung durch künstliche Int-Hair-ligenz 😉
Einzelne Haare für eine Freistellung zu malen, dürften die meisten von uns noch hinbekommen. Aber mal eben die Frisur vom Foto der einen Person auf ein Foto einer anderen Person zu übertragen? Die Barbershop-KI liefert schon beeindruckende Ergebnisse.
In diesem Video werden Funktionsweise und Möglichkeiten treffend und kompakt gezeigt und erklärt (Englisch):
Youtube:
Spannend ist dieser digitale Friseursalon vor allem auch als Frisuren-Generator. Exaktes Freistellen kann dann schon einmal durch Umstylen mittels KI ersetzt werden.
Gebetsmaschine
Zum Abschluss noch etwas Skurriles. „The Prayer” (deutsch „Das Gebet“) ist eine Kunstinstallation von Diemut Strebe, die sich zurzeit im Centre Pompidou in Paris befindet. Sie hat das Nötigste, was es für ein Gebet benötigt: Nase und Mund. Die an gregorianische Gesänge erinnernden Wortfetzen werden dabei durch eine KI generiert und rund um die Uhr rezitiert. Das klingt Gebeten täuschend ähnlich – wirkt aber natüüüüürlich nicht so gut echte Gebete™, denn das wäre ja Magie oder Blasphemie. 😉
Youtube:
Ab wann kann man denn von KI sprechen? Wenn die Asimov’schen Gesetze erfüllt werden. Das ist eine sehr einfache Definition, denn sie setzt ERKENNTNIS voraus. Akkes, was uns heute Marketingleute als KI verklickern, ist ein Marketingschmäh. Software, oder heutige Algorithmen, sind nicht intelligent. Sie können das, was ihnen mehr oder weniger intelligente Programmierer,die Algotithmen, die mehr oder weniger intelligente Informatiker und Mathematiker erdacht haben, abarbeiten. Normale Benutzer sind noch immer erstaunt, wie rasch Rechner aller Art ihre Aufgaben erledigen, doch nur weil ein Ergebnis herauskommt, das früher oder später eventuell auch Menschen erreicht hätten, sind weder Computer noch Programme intelligent.
Also, bleiben wir endlich mal am Boden der Realität und lassen uns nicht vom Marketingleuten und anderen den Unsinn von KI einreden.
Das mit der Magie ist ja ein alter Hut, von Medizinmännern, Religionen bis Jahrmarktgauklern haben ihr Geschäftsmodell darauf gegründet. Nur wird die Grenze der Magie immer weiter ausgedehnt. Eigentlich sollte Bildung dazu führen, dass man werten erlernt. Ist aber nicht so. Vielleicht gibt es in ferner Zukunft auf der Erde auch mal intelligente Lebewesen. Die Lebensdauer der Sonne könnte ja reichen.
Asimovs Robotergesetze beschreiben nicht, was Künstliche Intelligenz ist, sondern wie sich eine Künstliche Intelligenz verhalten sollte, um für Menschen nützliche Funktionen zu erfüllen. Seit Alan Turing geht man üblicherweise von der Definition aus, dass KI die Leistung einer Maschine sei, die, wäre sie von einem Menschen erbracht worden, als intelligent gelten würde. Allerdings hat jemand mal bemerkt, dass das Forschungsgebiet der Künstlichen Intelligenz keine Erfolge erzielen könne, denn wann immer es gelänge, eine bestimmte menschliche Leistung von einer Maschine erbringen zu lassen, würde man sie nicht mehr als Beispiel für Intelligenz ansehen. Beispielsweise war man vor 70 Jahren allgemein der Meinung, dass Schachspiel auf Großmeisterniveau ein hohes Maß an Intelligenz voraussetze. Wenn es also gelänge, eine Maschine Schach auf diesem Niveau spielen zu lassen, hätte man das Geheimnis menschlicher Intelligenz geknackt. Heute besiegen Maschinen längst den amtierenden Schachweltmeister, aber niemand sieht darin noch ein Beispiel für eine überragende generelle Intelligenz.
Wenn heute von KI die Rede ist, geht es meist nicht mehr um algorithmische Verfahren, die sich ein Softwareentwickler ausgedacht hätte, sondern um neuronale Netze, deren entscheidende Parameter mit Verfahren des maschinellen Lernens ermittelt werden. Wie die neuronalen Netze zu ihren Ergebnissen kommen, wird auch von ihren Entwicklern meist nicht vollständig verstanden, und das ist auch nicht zwingend notwendig. Herauszufinden, auf welche Weise ein solches KI-Verfahren zum Ziel führt, ist eine eigenständige Aufgabe, die zwar von wissenschaftlichem Interesse sein mag, aber wenn es um die Entwicklung von Anwendungssoftware geht, beschäftigt man sich nur damit, wenn etwas schief läuft – erst wenn man versteht, warum ein neuronales Netz in bestimmten Situationen falsche Ergebnisse liefert, weiß man, wie man ein Netz trainieren muss, um diese Fehler zu vermieden.
Mit Erkenntnis hat das alles nichts zu tun. „Erkenntnis“ taugt aber auch kaum als Kriterium, weil man sich dazu erst einmal auf eine handhabbare Definition davon einigen müsste. Die KI-Forschung beschäftigt sich letztendlich auch nicht damit – die anwendungsorientierte Forschung sowieso nicht, aber auch die Grundlagenforschung tut das nur am Rande. Wenn es um die Überwindung bisheriger Fehlleistungen von KI-Systemen geht, ist auch weniger fehlende Erkenntnis die Herausforderung, sondern der schiere Umfang, also die Breite der allgemeinen menschlichen Intelligenz, der für bestimmte, eng begrenzte Aufgaben trainierte neuronale Netze wenig entgegenzusetzen haben.
Es gibt keine Intelligenz ohne Erkenntnis. Wenn eine SW ein Objekt nicht als solches erkennt, ist sie nicht intelligent. Asimovs Robotergesetze setzen jedenfalls erkennen voraus, denn wer intelligent ist, kann Gegenstände und Lebewesen identifizieren. Und Asimovs Robotor können die Gesetze nur befolgen, weil sie Intelligenz haben. Diese paar Sätze von Asimov kann man keinem heutigen Computer geben, weil keiner sie verstehen kannn Das kann tatsächlich kein Algorithmus, keine Software und keine mathematische Beschreibung. Neuronale Netzwerke und SW die „lernt“ sind Krücken, können durch derzeitige Rechenleistung vieles leisten, doch haben nichts mit Intelligenz zu tun. KI ist ein Marketingschmäh, weil eben jede Generation irgendetwas herausragend finden muss. Und so gerne glaubt.