Bildbeschreibungen durch KI
In meinem Blogbeitrag von letzter Woche stellte ich Ihnen eine „Kamera“ vor, die kein Foto, sondern einen Prompt erzeugt, aus dem wiederum per KI ein Bild generiert wird. Bildbeschreibungen durch KI anhand von Bildern können Sie in Stable Diffusion oder Midjourney produzieren – und dadurch Inspiration für neue Prompts und neue Bilder erhalten. Ein neuer Kreativbooster.
Bildbeschreibungen durch KI
In Stable Diffusion können Sie ein Bild per CLIP-Interrogator analysieren und eine Bildbeschreibung generieren lassen. In Midjourney dient dazu der Befehl »/Describe« nach dessen Aufruf Sie ein Bild hochladen können, das dann von Midjourney beschrieben wird.
Das hat zwei Vorteile:
- Sie lernen, was und wie die jeweilige KI „sieht“ und Sie können eigene Prompts dadurch gezielter zusammenstellen.
- Sie lernen Querverbindungen kennen zu Begriffen, auf die man allein durch Nachdenken oder Nachschlagen nie gekommen wäre. Etwa bestimmte Künstler- oder Kunstgattungsnamen. Auch das erleichtert das „Prompten“.
- Sie können Bildwerke „nachkochen“ und nach eigenen Vorstellungen abwandeln.
Beispiele (Midjourney)
Ich habe einmal von Midjourney fünf meiner Fotos beschreiben lassen. »Describe« liefert dabei vier Promptvorschläge, die Sie mit einem Klick auf die jeweilige Nummer für eine Bildgenerierung anwenden. In den Screenshots sehen Sie jeweils die vier Prompt-Vorschläge und danach vier Beispiele, die mit einem der Vorschläge gerendert wurden. Schauen Sie sich ruhig einmal genauer an, welche Wörter und Beschreibungen da vorgeschlagen wurden. Fragen Sie sich, ob Sie auf diese Beschreibungen gekommen wären und wie Sie das jeweilige Bild beschrieben hätten.
Äffchen
Interessant, dass der große Bart des Äffchens als solcher identifiziert wurde. Prompt 2 enthielt diesen Hinweis nicht und dementsprechend fehlt ein Bart in den Ergebnissen:
Zwei Frauen
Hier enthalten die Prompts einige bekannte Künstlernamen. Interessant: Das in Prompt 4 vier Frauen beschrieben werden. Mit dem Zählen hat es eine KI eben nicht so.
Frau Seemann
Die Prompts generieren hier eine ziemliche Bandbreite an Ergebnissen. Wirklich fotorealistisch waren keine.
Parkruine
Interessant ist, dass die KI in einem Beispiel die D850 nennt. Tatsächlich wurde das Bild mit einem Vorgängermodell dieser Kamera aufgenommen – der Nikon D800. Auch das Nennen von spezifischen Kameras kann also einen Einfluss auf das Bildresultat haben. Die künstliche römische Ruine wurde aber nicht erkannt und korrekt beschrieben, sodass meist nur kleine Kapellen auf einer Lichtung generiert wurden.
Hosenträger-Porträt
Bildbeschreibungen durch KI: Hier fallen ebenfalls wieder viele Künstlernamen. Auch das Vintage-Thema (Boxerszene im 30er-Jahre-Stil) wurde erkannt.
Fundgrube Bildbeschreibung
Für mich ist der Describe-Befehl von Midjourney oder der CLIP-Interrogator von Stable Diffusion eine echte Fundgrube an kreativer und textlicher Inspiration geworden. Im Arsenal eines Künstlers ist dies eine weitere Kreativtechnik, mit der man neue Assoziationen und thematische Verknüpfungen aufbauen kann. Falls Sie sich also auf das Experiment KI einlassen, sollten Sie dieses Potenzial nicht brach liegen lassen.
Ich bin auf dies Weise auf Künstler wie etwa Dariusz Zawadzki und Zdzisław Beksiński gestoßen, die ich vorher (unbegreiflicherweise) nicht kannte. Einfach, indem ich ältere Bilder von mir beschreiben ließ.
Zusammen mit Stable Diffusion und etwas „Giger Style“ (den kennt ja spätestens seit „Alien“ jeder) konnte ich so viele einzelne Versatzstücke für mein Bild „Planet X: Der Nebel“ (Teil 1 einer Serie) generieren, die ich dann in Photoshop zusammenfügte und durch Übermalen und Einfügen weiterer Elemente ergänzte:
Mehr zur Geschichte dazu: Siehe Instagram.
Also: Lassen Sie sich von der KI inspirieren, indem Sie sie einfach einmal selbst Bilder beschreiben lassen.