Auf X (Ex-Twitter) und Instagram sind gerade KI-Bilder wie die oben abgebildeten populär, die erst bei unscharfem Hinsehen eine zunächst versteckte Botschaft vermitteln. Betrachter müssen dazu die Augen zusammenkneifen, als Kurzsichtiger die Brille abnehmen oder das Bild aus größerer Entfernung betrachten. Oben erkennen Sie dann das Nike- und das ehemalige Twitter-Symbol, darunter den Schriftzug „Peace“. | Olaf Giermann
01 Die Funktionsweise
Diese mit der generativen KI Stable Diffusion erzeugten Bilder basieren auf einem an sich einfachen Prinzip: Es wird eine Schwarzweiß-Maske benutzt, um die Textbeschreibung des gewünschten Bildes in gewisse Formen zu zwingen. In Stable Diffusion basiert das auf der Erweiterung »Control Net«. Das Bild rechts (b) habe ich mit der Textmaske (a) und dem Prompt »lots of different birds, close-up, jumping around on the ground« erzeugt. Das Ergebnis ist zwar nicht realistisch, wirkt jedoch so auf den ersten Blick und zeigt die Möglichkeiten der KI auf, eine Illusion zu erzeugen.
02 Stable Diffusion
Das Einrichten von Stable Diffusion auf dem eigenen Rechner ist eine Wissenschaft für sich. Das anschließende Abstimmen der Parameter ist dann eine große, aber ebenso undurchsichtige Spielwiese für das kreative Ausprobieren. Glücklicherweise gibt es hilfsbereite Anwender, die ein kostenloses Interface für die „Illusion Diffusion“ unter www.docma.info/22976 angelegt haben. Laden Sie entweder ein eigenes Schwarzweiß-Bild hoch (a) oder nutzen Sie eines der Samples (b). Der zentrale Trick ist, dass kleinere Werte für den »Guiding Scale« genauere Ergebnisse erzeugen. Der Prompt »a blue sky full of clouds« zeigt damit jedenfalls den gewünschten Schriftzug (c).
03 Experimente
Um gute Ergebnisse zu erhalten, ist einiges an Experimentieren mit dem Prompt und den Einstellungen nötig. Letztlich ist es wie so oft bei KI-generierten Bildern: Es wird nur das beste Zufallsergebnis veröffentlicht, das nicht unbedingt der ursprünglichen Vorstellung des Kreativschaffenden entspricht. Hier einige Ergebnisse, die den berühmten (mutmaßlichen!) Ausspruch von Winston Churchill visualisieren sollen.
Prompt: »a photo of fat politicians in a busy environment, Winston Churchill, smoking«