KI-Prompt Inspiration: Describe

Christoph Künne8. April 2023

4 Minuten Lesezeit

Wie formuliert man einen KI-Prompt richtig? Nun, klare Regeln gibt es (noch) nicht, aber einige Experten haben inzwischen Systeme erdacht, wie man vorgehen kann. In der nächsten DOCMA werden wir dazu einen ausführlichen Beitrag bringen. Aber was macht man ohne solch ein System? Einfach sprachlich loslegen, wie einem der Schnabel gewachsen ist? Das funktioniert zwar, aber meist nur, wenn die eigenen Ansprüche nicht sonderlich hoch sind.

KI-Bildbeschreibung mit ChatGPT

Alternativen? Sich von einer anderen KI helfen lassen. So kann man etwa Bilder, die sehr bekannt sind, und einen eindeutigen Titel haben, von ChatGPT beschreiben lassen. Natürlich möglichst gleich in englischer Sprache, damit man das Ergebnis direkt in ein Text-2-Image-System kopieren kann. Ein Beispiel: „Der Kuss“ von Robert Doisneau

Ganz so einfach mit Copy und Paste geht das allerdings doch nicht, aber man bekommt durch Kürzungen dennoch schnell einen brauchbaren Text-Prompt:

Midjourney Prompt: »A wide angle lens black and white photograph taken in 1950, captures a tender moment between a young couple sharing a passionate kiss in the busy streets of Paris, France. In the foreground of the image, the couple is oblivious to their surroundings as they embrace each other. The man, dressed in a dapper suit, has his right arm around the woman, while his left hand gently cradles her face. The woman, wearing a stylish dress, has her arms wrapped around the man's neck, further drawing him in. Their eyes are closed, emphasizing the emotion and intimacy of the moment.The backdrop of the photograph is the bustling Parisian street near the Hôtel de Ville, a prominent and historic building that serves as the city's administrative center. The street is filled with pedestrians, bicycles, and cars, highlighting the contrast between the private, romantic moment shared by the couple and the dynamic, public setting around them. --ar 3:2 --s 750 --q 2 --v 5«. KI-Prompt Inspiration: Describe — Midjourney Prompt: »A wide angle lens black and white photograph taken in 1950, captures a tender moment between a young couple sharing a passionate kiss in the busy streets of Paris, France. In the foreground of the image, the couple is oblivious to their surroundings as they embrace each other. The man, dressed in a dapper suit, has his right arm around the woman, while his left hand gently cradles her face. The woman, wearing a stylish dress, has her arms wrapped around the man’s neck, further drawing him in. Their eyes are closed, emphasizing the emotion and intimacy of the moment.The backdrop of the photograph is the bustling Parisian street near the Hôtel de Ville, a prominent and historic building that serves as the city’s administrative center. The street is filled with pedestrians, bicycles, and cars, highlighting the contrast between the private, romantic moment shared by the couple and the dynamic, public setting around them. –ar 3:2 –s 750 –q 2 –v 5«

Wir sehen: Die Idee funktioniert im Prinzip, die Bilder haben entfernt mit dem Original zu tun – zumindest thematisch. Aber auf Details sollte man nicht zu sehr achten.

KI-Bildbeschreibung mit Midjourney

Seit ein paar Tagen hat nun auch Midjourney eine Bildbeschreibungs-Funktion. Allerdings ist man dort nicht auf bekannte Bilder mit eindeutigen Titeln angewiesen, sondern kann einfach eigene Motive hochladen und sie sich beschreiben lassen. Der Befehl dazu lautet: »/describe [BILD]«

Zu sehen ist eine Frau nachts in einem Auto. Schauen wir mal, was Midjourneys neuer Befehl daraus macht …
Kleiner Hinweis: Bilder mit viel Haut mag das System gar nicht und verweigert die Beschreibung. Also bitte nur züchtige Motive verwenden.

Midjourney hat vier Beschreibungen erzeugt, die man per Klick auf das jeweilige Zahlenfeld berechnen lassen kann.

»a model sitting in the driver's seat of a vintage car, in the style of bioluminescence, freakshow, national geographic photo, high quality photo, candid atmosphere, maria kreyn, stock photo --ar 10:7 --s 750 --q 2 --v 5«. KI-Prompt Inspiration: Describe — »a model sitting in the driver’s seat of a vintage car, in the style of bioluminescence, freakshow, national geographic photo, high quality photo, candid atmosphere, maria kreyn, stock photo –ar 10:7 –s 750 –q 2 –v 5«

Thema getroffen, aber der Teil des Konzepts, der beschreibt, was man mit seinen Händen beim Autofahren tut, ist hier und bei den meisten anderen noch ein wenig trainingsbedürftig.

»a person is driving a night car for some reason, in the style of retro glamour, vibrant portraiture, freakshow, national geographic photo, pre-world war ii school of paris, photo taken with provia, chiaroscuro portraitures --ar 10:7 --s 750 --q 2 --v 5«. KI-Prompt Inspiration: Describe — »a person is driving a night car for some reason, in the style of retro glamour, vibrant portraiture, freakshow, national geographic photo, pre-world war ii school of paris, photo taken with provia, chiaroscuro portraitures –ar 10:7 –s 750 –q 2 –v 5«

Insgesamt recht gut getroffen – selbst die Darstellung des Autofahrens.

»lisa jackson driving nighttime at a red light 2016, in the style of matthias haker, retro glamour, amy earles, ivan albright, stockphoto, candid atmosphere, 1940s–1950s --ar 10:7 --s 750 --q 2 --v 5«. KI-Prompt Inspiration: Describe — »lisa jackson driving nighttime at a red light 2016, in the style of matthias haker, retro glamour, amy earles, ivan albright, stockphoto, candid atmosphere, 1940s–1950s –ar 10:7 –s 750 –q 2 –v 5«

Kennt jemand „Lisa Jackson“? Ich habe bei Google nur eine Autorin gefunden, aber die sieht ganz anders aus. In jedem Fall ist Lisa keine passionierte Chauffeurin.

»gif of a blonde sitting inside an old car, in the style of chiaroscuro lighting, traditional portraiture, leica i, carnivalesque, national geographic photo, stock photo, high quality photo --ar 10:7 --s 750 --q 2 --v 5« — »gif of a blonde sitting inside an old car, in the style of chiaroscuro lighting, traditional portraiture, leica i, carnivalesque, national geographic photo, stock photo, high quality photo –ar 10:7 –s 750 –q 2 –v 5«

Abgesehen von Details zeigt sich deutlich: Zumindest bei diesem Beispiel hat die Inhalts- und Stilübertragung ganz ordentlich funktioniert. Andere Test-Bespiele haben den Eindruck verfestigt. Die neue „Describe“-Funktion von Midjourney scheint also ein brauchbarer Ansatz zu sein, um das Bescheibungs-Prompt-Problem besser in den Griff zu bekommen.

Zum Vergleich: ein Versuch mit dem Kuss von Robert Doisneau

»person on march 22, 1961 the photograph is a black and white image of two people kissing, in the style of post-world war ii school of paris, street style realism, 1940s–1950s, emphasizes emotion over realism, back button focus, feminine affluence, frayed --ar 29:23 --s 750 --q 2 --v 5« — »person on march 22, 1961 the photograph is a black and white image of two people kissing, in the style of post-world war ii school of paris, street style realism, 1940s–1950s, emphasizes emotion over realism, back button focus, feminine affluence, frayed –ar 29:23 –s 750 –q 2 –v 5«

Das erinnert sehr an die Bilder oben.

»young couple outside, french paris, in the style of post-world war ii art, photobash, emotional narrative, notable sense of movement, detailed crowd scenes, school of london, love and romance --ar 29:23 --s 750 --q 2 --v 5« — »young couple outside, french paris, in the style of post-world war ii art, photobash, emotional narrative, notable sense of movement, detailed crowd scenes, school of london, love and romance –ar 29:23 –s 750 –q 2 –v 5«

Bunt und im Look eher an ein kommunistisches Klassenkampfepos erinnernd.

»a couple of people walking beside each other hugging, in the style of post-world war ii school of paris, emotional and dramatic scenes, françois boquet, 1940s–1950s, john chamberlain, candid shots of famous figures, silvestro lega --ar 29:23 --s 750 --q 2 --v 5« — »a couple of people walking beside each other hugging, in the style of post-world war ii school of paris, emotional and dramatic scenes, françois boquet, 1940s–1950s, john chamberlain, candid shots of famous figures, silvestro lega –ar 29:23 –s 750 –q 2 –v 5«

Schon näher am Ziel! Vor allem deshalb, weil sich der Kamerastandpunkt etwas nach hinten verlagert hat und man mehr von dem Paar sieht.

»the kiss, by jules seargent & claire reynaud 1952, in the style of urban emotions, candid atmosphere --ar 29:23 --s 750 --q 2 --v 5« — »the kiss, by jules seargent & claire reynaud 1952, in the style of urban emotions, candid atmosphere –ar 29:23 –s 750 –q 2 –v 5«

Der eher knappe Prompt führt nicht zu treffenderen Resultaten.

Schlagworte

Christoph Künne8. April 2023

4 Minuten Lesezeit

Zeig mehr

7 Kommentare

Peter Gradischnigg sagt:

8. April 2023 um 12:58 Uhr

Aus den Bildern kann man schließen, dass die Lerndatenbank mit vielen Köpfen und nur wenigen Autos gespeist wurde. Man sieht viele verkrümmte und unmögliche Lenkräder, doch keine verbogene Nase.
So geschieht es eben, wenn man nichts, absolut nichts erkennt.
KI ist eben ein Synonym für natürliche Dummheit.

Zum Antworten anmelden
Michael J. Hußmann sagt:

9. April 2023 um 2:27 Uhr

Mit Lisa Jackson könnte sie gemeint sein: https://www.gettyimages.de/fotos/lisa-jackson-model

Aber wieso erkennt Midjourney da ein GIF? Und soll mit „leica i“ die Leica I von 1925 gemeint sein? Aber was spräche dann dafür, dass das Bild mit einer Schraubleica entstanden wäre?

Zum Antworten anmelden
docmawinfried54 sagt:

9. April 2023 um 23:25 Uhr

Naja die KI kann mal besser mal schlechter sein, bei den sich küssenden sieht man in einem Bild wie zwei Nasen sehr künstlerisch sich verschmelzen. Sieht sehr nach Salvador Dali aus.

Zum Antworten anmelden
Frank Butter sagt:

11. Juni 2023 um 16:19 Uhr

Ich würde mir wünschen, dass DOCMA den lächerlichen Hype-Begriff „Prompt“ in diesem Zusammenhang vermeidet. Ein Prompt ist seit etwa 50 Jahren (oder länger?) eine „Eingabeaufforderung“ von Computer-Benutzerinterfaces, so auch bei den heute gängigen KIs. Es wird damit also keinesfalls das bezeichnet, was man da eingibt, sondern lediglich der Hinweis einer Maschine, dass man nun etwas eingeben kann. Zudem werden sich die KIs zunehmend zu Dialogsystemen weiterentwickeln. Der Begriff passt somit immer weniger.

Die Anweisungen bzw. bei einigen KIs den Dialog „Prompt“ zu nennen, ist in etwa so sinnvoll, wie ein Mobiltelefon als „Handy“ zu titulieren. Klingt wie eine Englische Bezeichnung, ist es aber nicht. Hat sich in vielen deutschen Kreisen leider trotzdem durchgesetzt – auch durch die Medien, entstand aber aus falschem Verständnis. Ein Mobiltelefon kann durchaus „handy“ (praktisch/handlich) sein – das ist aber nicht die Bezeichnung des Gerätes, sondern eine seiner Eigenschaften. Heute denkt die Welt, das sei ein urdeutscher Begriff.
Mit Klarheit in der Sprache geht Verständnis los. Wir können natürlich auch darauf warten, bis eine KI uns das erklärt… 😉

Zum Antworten anmelden
1. Frank Butter sagt:
  
  11. Juni 2023 um 16:27 Uhr
  
  ChatGPT4 sagt dazu übrigens:
  „Ein Prompt ist ein Zeichen oder eine Anzeige auf einem Computer oder einer mobilen Anwendung, die den Benutzer auffordert, eine Aktion auszuführen oder eine Eingabe zu machen. Ein häufiges Beispiel für einen Prompt ist das Eingabeaufforderungsfenster in einem Betriebssystem oder einer Programmiersprache, in dem Benutzer Befehle eingeben können. Prompts können auch in Form von Dialogfeldern oder Pop-ups erscheinen und den Benutzer auffordern, eine Entscheidung zu treffen oder eine Information zu geben.
  Tatsächlich ist ein Prompt eine Aufforderung oder Eingabeaufforderung, die von einer Maschine, einschließlich eines Computers oder einer KI, an den Benutzer gerichtet wird. Es handelt sich um ein Signal oder eine Meldung, die darauf wartet, dass der Benutzer eine Eingabe tätigt, wie zum Beispiel eine Antwort auf eine Frage oder eine Eingabeaufforderung zur Ausführung einer bestimmten Aktion. Ein Beispiel für einen Prompt in Bezug auf eine KI wäre eine Frage wie „Was möchten Sie tun?“ oder eine Anweisung wie „Bitte sagen Sie ‚ja‘ oder ’nein'“.“
  
  Zum Antworten anmelden
2. Frank Butter sagt:
  
  11. Juni 2023 um 16:31 Uhr
  
  ChatGPT4 zur Verwendung des Begriffes: 😉
  Es gibt möglicherweise mehrere Gründe, warum einige Menschen den Begriff „Prompt“ falsch verwenden. Hier sind einige mögliche Gründe:
  
  1. Mangelnde Kenntnisse: Einige Menschen haben möglicherweise nicht genügend Kenntnisse über die Technologie und die korrekten Fachbegriffe. Aus diesem Grund können sie den Begriff „Prompt“ fälschlicherweise verwenden.
  
  2. Verwechslung mit anderen Begriffen: Einige Menschen können den Begriff „Prompt“ mit anderen ähnlichen Begriffen wie „Befehl“ oder „Anweisung“ verwechseln, was zu einer falschen Verwendung führen kann.
  
  3. Verwendung in verschiedenen Kontexten: Der Begriff „Prompt“ wird in verschiedenen Kontexten verwendet, z. B. in der Programmierung, in der Benutzeroberfläche und in der Künstlichen Intelligenz. Einige Menschen können den Begriff möglicherweise in einem Kontext gehört oder gelernt haben und ihn dann in einem anderen Kontext falsch verwenden.
  
  Insgesamt kann die Verwendung von Fachbegriffen wie „Prompt“ manchmal verwirrend sein, insbesondere wenn sie in verschiedenen Kontexten verwendet werden. Es ist jedoch wichtig, die richtigen Begriffe zu verwenden, um Missverständnisse zu vermeiden und eine klare Kommunikation zu gewährleisten.
  
  Zum Antworten anmelden
3. Michael J. Hußmann sagt:
  
  11. Juni 2023 um 18:58 Uhr
  
  Wir verwenden den Begriff „Prompt“, weil das in der englischen Fachsprache nun mal so heißt und noch niemandem ein guter deutscher Begriff dafür eingefallen ist (so weit ich weiß). Auch in Zusammensetzungen wie „prompt engineering“ kommt das Wort vor. Das englische „Prompt“ kann unter anderem „Abfrage“, „Vorgabe“, „Anstoß“ oder „Stichwort“ (im Theater – das Stichwort, das eine Souffleuse einem Schauspieler gibt) bedeuten, und die Verwendung dieses Wortes im Bereich der generativen KI lag daher nahe – es passt einfach. (Die Antwort, die Sie von ChatGPT bekommen haben, führt in die Irre, da sie nur eine sehr spezielle und nicht die ursprüngliche Bedeutung des Wortes erwähnt. „Prompt“ im Sinne einer Eingabeaufforderung eines Computers an einen Benutzer ist ja selbst eine relativ junge, erst gut 50 Jahre alte Lesart, während das Wort sehr viel älter – älter als der Computer – ist. Es geht auf das lateinische „promo“ zurück, das „hervorholen“ oder auch „an den Tag bringen“ bedeuten kann. Auf den Wahrheitsgehalt von ChatGPT-Auskünften kann man sich eben nicht verlassen.)
  
  Man kann natürlich versuchen, eigene Bezeichnungen zu prägen, wenn einem die Gebräuchlichen nicht gefallen, aber meist greift das dann niemand auf, und wenn man darauf insistiert, wirkt man irgendwann sonderlich. Und wir haben ja nicht einmal ein Problem mit dem Wort „Prompt“, weshalb wir es auch in Zukunft weiter verwenden werden.
  
  Zum Antworten anmelden

Schreibe einen Kommentar Antworten abbrechen

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Jakob Bosch
Auch von mir vielen Dank! Sind die Farben im Bild einigermas...
HappyPeso
Klingt ja mega spannend! Die KI-Features sind echt krass, be...
Gernot Armbruster
Danke für diese Photoshop Aktion. Funktioniert sehr gut und...
Michael J. Hußmann
Ja, die Identifizierung bestimmter Personen aufgrund unverän...
Olaf Giermann
OK, die integrierten Schreibtools sind nett. Aber die basier...

KI-Prompt Inspiration: Describe

KI-Bildbeschreibung mit ChatGPT

KI-Bildbeschreibung mit Midjourney

Zum Vergleich: ein Versuch mit dem Kuss von Robert Doisneau

Christoph Künne

7 Kommentare

Schreibe einen Kommentar Antworten abbrechen

HAIBRIDS – das Buch zum Projekt ist jetzt lieferbar

Menschen fotografieren

Neu im DOCMA-Shop: Vintage Objektive, die 7. Auflage

Historische Kino-Objektive – der neue Kieckhöfel

Niépce Recoded: KI bringt neues Leben ins älteste Foto der Welt

Piraten – Bilder und Geschichten

KI-Bildbeschreibung mit ChatGPT

KI-Bildbeschreibung mit Midjourney

Zum Vergleich: ein Versuch mit dem Kuss von Robert Doisneau

Christoph Künne

Ähnliche Artikel

Apple Intelligence: Viel Tamtam um eine KI-Luftnummer?

Jetzt den Überblick behalten und Neues lernen: In der KI-Medienschule des PHOTO+MEDIENFORUM KIEL

Rotkäppchen-Illustration? Geht gar nicht!

KI … und Kunst?

7 Kommentare

Schreibe einen Kommentar Antworten abbrechen