Es ist ein weitverbreitetes Missverständnis, dass aktuelle KI-Systeme auf Basis neuronaler Netze im Einsatz weiter dazulernen und sich selbst verbessern würden. Genau genommen lernen sie aber nicht einmal in der Trainingsphase, die ihrem Praxiseinsatz vorausgeht.
Um eines gleich klarzustellen: Neuronale Netze sind im Grundsatz durchaus lernfähig. Schließlich ist unser Gehirn ein neuronales Netz, und wenn das nicht lernen könnte, wäre ich nicht in der Lage, diesen Text zu schreiben, und Sie nicht, ihn zu lesen und zu verstehen. Aber die Art künstlicher neuronaler Netze, die heutzutage allgegenwärtig sind und auf Zuruf Bilder generieren, Motive in Bildern erkennen oder Unterhaltungen führen, die können es nicht. Sie können es schon deshalb nicht, weil sie sich im Einsatz beim Anwender nicht mehr verändern.
Vor dem Einsatz liegt die Trainingsphase, in der ein neuronales Netz überhaupt erst seine besonderen Fähigkeiten erwirbt, und dazu muss es sich verformen lassen. Erst am Ende seiner Ausbildung wird es in seinem Zustand eingefroren. Man könnte das mit dem Sprichwort „Was Hänschen nicht lernt, lernt Hans nimmermehr“ umschreiben, doch schon im Training findet eigentlich kein Lernen statt – zumindest nicht das, was wir gewöhnlich unter „Lernen“ verstehen. Man spricht in diesem Zusammenhang zwar von Verfahren des maschinellen Lernens, nur handelt es sich eher um maschinelle Lehrverfahren – die für den Trainingserfolg entscheidende Leistung wird nicht vom Schüler erbracht, sondern vom Lehrer.
Nehmen wir als Beispiel ein neuronales Netz, das erkennen soll, ob in einem Bild eine Katze zu sehen ist. Der Input sind zweidimensionale Pixelbilder, der Output ein simples wahr (Katze) oder falsch (keine Katze). Kleine Kinder lernen so etwas nebenbei. Man braucht nur auf die Katzen in Bilderbüchern hinzuweisen oder, sofern vorhanden, auf echte Katzen, und das Kind wird die entscheidenden Merkmale von (Abbildungen von) Katzen identifizieren und diese so weit generalisieren, dass es bald „Katze“ oder „Miau“ sagen wird, wenn – und nur wenn – es eine sieht. Eine besondere Anleitung ist dazu nicht einmal nötig; Kinder schnappen von selbst auf, was die Erwachsenen zu verschiedenen Dingen sagen, und auf diese Weise lernen sie in den ersten Jahren des Spracherwerbs so etwa fünf bis sieben Wörter pro Tag. Kinder kommen zwar nicht als geborene Katzenerkenner auf die Welt, aber sie sind geborene Lerner.
Ein künstliches neuronales Netz, das eine solche Erkennungsaufgabe bewältigen soll, hat keinerlei allgemeine Lernkompetenz. Es wird niemals etwas anderes tun als zu versuchen, Katzen in Bildern zu erkennen, und das gilt auch für die Trainingsphase. Der Unterschied zwischen Training und Praxiseinsatz besteht lediglich darin, dass es zunächst ein lausiger Katzenerkenner ist, der nur zufällig einmal die richtige Antwort gibt, nach dem Ende des Trainings aber treffsicher die Katzenbilder (und nur diese) heraus pickt.
Das Training macht also den Unterschied. Dazu werden immer wieder Bilder mit und ohne Katzen aus einem möglichst großen Trainingskorpus als Input in das Netz eingespeist und dessen Output mit der richtigen Antwort verglichen. Ist die Antwort falsch, werden die das neuronale Netz definierenden Variablen, nämlich die Verbindungen zwischen den künstlichen Neuronen, in minimalen Schritten so verändert, dass eine richtige Antwort in der Folge etwas wahrscheinlicher wird. Kleine Schritte sind nötig, weil es ja nicht allein um die richtige Antwort zum gerade präsentierten Bild geht, sondern um eine allgemeingültige Erkennungsleistung. An diese muss man das Netz langsam heranführen, ohne es vorschnell in eine bestimmte – und letztendlich womöglich falsche – Richtung zu zwingen.
Alle für das Training wichtigen Faktoren, von der Auswahl des Trainingsmaterials bis zur Methode, die Variablen des Netzes behutsam anzupassen, sind Teil eines Lehrverfahrens. Wenn das neuronale Netz schließlich die gewünschte Fähigkeit nachgewiesen hat (wofür es sich auch in der Klassifizierung von Bildern bewähren muss, die es im Training nicht gesehen hatte), verlässt es die „Schule“ und verliert mit seinem „Lehrer“ auch die Fähigkeit, sich weiter zu verbessern – eine Fähigkeit, die es ja aus eigener Kraft nie gehabt hatte.
Mit einer Schule, wie wir sie kennen, hat das Training eines neuronalen Netzes nichts gemein. In der Schule muss man zwar ebenfalls Testverfahren wie Klassenarbeiten oder mündliche Prüfungen durchlaufen, doch diese spielen für den Lernerfolg keine Rolle – sie sollten den Erfolg oder Misserfolg bloß kontrollieren und dokumentieren. Wenn Schüler in einem Test versagen, werden ihre Gehirne (glücklicherweise, muss man wohl sagen) nicht neu justiert. Die Lehrer bemühen sich nicht einmal (leider, muss man mit ebensolchem Recht sagen), den Problemschülern das fehlende Wissen oder die Fertigkeiten auf irgendeine Weise doch noch zu vermitteln. Die Lernleistung muss allein vom Schüler erbracht werden. Etwas simplifizierend könnte man die Schule so beschreiben, dass Schüler mit Wissen beworfen werden, in der Hoffnung, dass etwas kleben bleibt.
Immerhin besitzen wir die nötige allgemeine Lernkompetenz. Schon vor der Einschulung hat uns diese dazu befähigt, krabbeln, laufen, sprechen, Katzen erkennen und vieles andere zu lernen, und sie verlässt uns auch im weiteren Leben nicht. Wir beobachten unsere Welt und ziehen Schlussfolgerungen daraus, und sofern uns nicht die Demenz unsere Errungenschaften im Alter nimmt, lernen wir immer weiter dazu. KI-Systeme, denen man etwas Vergleichbares zur menschlichen Intelligenz zusprechen könnte, müssten dieselben Fähigkeiten mitbringen, und bis dahin ist es noch ein weiter Weg.
Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.