Text-zu-Bild-Systeme: Wissenslücken der KI
Die Weiterentwicklung von Text-zu-Bild-Systemen macht so rasante Fortschritte, dass Fotografen und Illustratoren bereits um ihre Jobs fürchten – einerseits. Andererseits unterlaufen solchen KI-Systemen oft eklatante Fehler, die ihnen nur mühsam abzutrainieren sind. Michael J. Hußmann klärt die Frage, warum sich die KI in manchen Bereichen immer noch schwer tut.
Obwohl die von KIs erzeugten Bilder von Monat zu Monat hochauflösender, detailreicher und realistischer zu werden scheinen, kommt es noch immer vor, dass die Kreationen bei genauerem Hinsehen befremdlich wirken: Gesichter und Körper erscheinen deformiert; Augen befinden sich nicht an der richtigen Stelle und die Zahl der Gliedmaßen oder deren Größenverhältnisse sind unstimmig – die Bilder wirken unfreiwillig surrealistisch. Warum kommt es noch immer zu so krassen Fehlern?
Neuronale Netze, wie sie dem hier zur Illustration verwendeten Stable Diffusion (javascript:alert(‚Der Link ist nur unsere docma2go-Nutzer verfügbar‘);) wie auch allen anderen Text-zu-Bild-Systemen zugrunde liegen, werden nicht …
Dieser Inhalt ist Teil unserer Premium-Inhalte von DOCMA2go.
Als Abonnent einloggen
DOCMA 2GO abonnieren
Das DOCMA-Magazin als wöchentliches E-Mail-Update. Mehr erfahren.
- Nur 3,99 EUR/Monat