Text-zu-Bild-Systeme: Wissenslücken der KI

Alle Bilder, sofern nicht anders angegeben: Stable Diffusion / Michael J. Hußmann

Die Weiterentwicklung von Text-zu-Bild-Systemen macht so rasante Fortschritte, dass Fotografen und Illustratoren bereits um ihre Jobs fürchten – einerseits. Andererseits unterlaufen solchen KI-Systemen oft eklatante Fehler, die ihnen nur mühsam abzutrainieren sind. Michael J. Hußmann klärt die Frage, warum sich die KI in manchen Bereichen immer noch schwer tut.

Obwohl die von KIs erzeugten Bilder von Monat zu Monat hochauflösender, detailreicher und realistischer zu werden scheinen, kommt es noch immer vor, dass die Kreationen bei genauerem Hinsehen befremdlich wirken: Gesichter und Körper erscheinen deformiert; Augen befinden sich nicht an der richtigen Stelle und die Zahl der Gliedmaßen oder deren Größenverhältnisse sind unstimmig – die Bilder wirken unfreiwillig surrealistisch. Warum kommt es noch immer zu so krassen Fehlern?

Neuronale Netze, wie sie dem hier zur Illustration verwendeten Stable Diffusion (javascript:alert(‚Der Link ist nur unsere docma2go-Nutzer verfügbar‘);) wie auch allen anderen Text-zu-Bild-Systemen zugrunde liegen, werden nicht …

Dieser Inhalt ist Teil unserer Premium-Inhalte von DOCMA2go.

Als Abonnent einloggen

DOCMA 2GO abonnieren

Das DOCMA-Magazin als wöchentliches E-Mail-Update. Mehr erfahren.

Nur 3,99 EUR/Monat

Zur Bestellung

Renate Blaes
Dem Beitrag gibt es nichts hinzuzufügen, außer: danke! Ich l...
alex nemec
Vielen Dank für den Artikel! Nach etwa einem Jahr mit KI als...
peter braubnschmid
bezieht sich wohl auf: (das Bild finden Sie bei Pexels.com)...
Olaf Giermann
Worauf bezieht sich Ihr Kommentar? Ich kann hier keinen Zusa...
Franz Svoboda
Die Angabe wie man das Bild findet iswt zu wenig....

Text-zu-Bild-Systeme: Wissenslücken der KI

Als Abonnent einloggen

DOCMA 2GO abonnieren

Schreiben Sie einen Kommentar Antworten abbrechen

Das Buch: Die Geheimnisse perfekter Prompts

Kunst (besser) verstehen

Was will uns der Künstler damit sagen?

Alles so schön bunt hier

Acrobat AI Assistant – echtes Interview mit einem Buch dank KI?

Interview mit einem Buch: Nachtfotografie

Behance

Splash Screen ändern

Kreativ mit der Gradationskurve

Ansicht Temporär (nicht)ausrichten

Photoshop-Vorgaben verwalten: Vorgaben ohne Installation laden

Neu in Affinity Photo 2: Live-Bandpass-Maske

DOCMA Freistellen 2.0: Mehrere Objekte maskieren

Nur Raw-Dateien importieren

Generatives Füllen in Lightroom und Neues in Photoshop & Co.