KI-Prompt Inspiration: Prompts erarbeiten II
In der letzten Folge der Prompt Inspiration haben wir uns mit dem Erarbeiten von Prompts mithilfe des Describe-Befehls befasst – und mussten zu dem Ergebnis kommen, dass man zwar viel über Beschreibungen lernen kann, aber dennoch keine allzu ähnlichen Bildergebnisse erhält. Dieses Mal geht es um Optimierungsstrategien.
Prompt Analyse
Wenn man sich die per Describe-Funktion ermittelten Prompts genauer anschaut, dann wird schnell klar: Sie sind zwar relativ stark bei der Zuweisung von Stilen, lassen aber in Sachen Bildinhalt sehr zu wünschen übrig. Entsprechend kommt man also kaum um die selbstverfasste Inhaltsbeschreibung herum. In unserem Fall handelt es sich um einen breitbeinig stehenden Bergsteiger vor alpiner Kulisse. Das Gerät in seiner Armbeuge ist ein Eispickel. Bemerkenswert für die Bildwirkung ist zudem der tiefe Kamerawinkel.
Eigene inhaltliche Beschreibung
Das Ergebnis geht in die richtige Richtung, zeigt aber durchaus noch Defizite. Der Eispickel ist augenscheinlich ein derart aus der Mode gekommenes Werkzeug, dass Midjourney es nicht kennt. Auch ist der KI der Zusammenhang zwischen alpinen Temperaturen auf verschneiten Berggipfeln und nackter Haut wenig geläufig. Aber vielleicht entblößen die männlichen Bergsteiger, die bis zum Gipfel kommen, für die dort entstehenden Fotos ja mehrheitlich ihre Oberkörper.
Ein Vergleichstest mit Bergsteigerinnen lässt diese Beobachtung als typische männliche Geste erscheinen. Hier sieht man also entweder die Prüderie der KI oder ihre Vorurteile.
Also ziehen wir den Mann erst einmal – unserer Vorlage entsprechend – mit einem weißen Hemd einer schwarzen Hose und Stiefeln an. Auch hier sollte man möglichst präzise formulieren: Also ein weißes Hemd mit Kragen, eine lange schwarze Hose und schwarze Bergstiefel.
Zeitmaschine
Mit einer Zeitangabe (1940 – 1950s), wie wir sie von der Describe-Funktion hatten ermitteln lassen, ist schon einges getan. Die Bergsteiger sehen nun erheblich weniger nach den 2020ern aus. Aber so heldenhaft wie auf dem Ausgangsbild erschienen sie noch nicht.
Stilistische Anleihen
Zitieren wir im Prompt also die stilistischen Anleihen, die Describe ermittelt hat. Das waren vor allem drei Fotografen. Verwendet man sie alle drei als Stilvorgabe, sieht es schon etwas heldenhafter aus.
Zitiert man nur einen der Fotografen als Stilvorlage im Prompt, wird es noch besser und vor allem weniger bunt.
Reformierung
Weil mich das Ausgangsbild sehr klar an Leni Riefenstahls Heldenbilder der 30er Jahre erinnerte, habe ich den Prompt noch etwas spezifischer in diese Richtung formuliert. Allerdings bleibt dann nichts mehr von dem erhalten, was die Describe-Funktion ermittelt hat.
Fazit
Die besten Ergebnisse kommen dann heraus, wenn man selbst genau sagen kann, was man auf dem Bild sehen will. Midjourney eine Bildbeschreibung errechnen zu lassen, ist bestenfalls ein guter Startpunkt.