Unter dem Titel „KI-Bilder – alles eine Frage des Prompts!“ hat der bekannte TV-Wissenschaftsmoderator Gert Scobel KI-generierte Bilder kommentiert und kritisiert. Da er auch Philosoph ist, ist es erlaubt, seine Worte exakt zu analysieren und ernstzunehmen und darüber nachzudenken, ob er recht hat. Stimmt es, dass KI-Bilder völliges Mittelmaß sind? Doc Baumann ist Scobels Aufforderung, selber zu denken, gefolgt und kommt zu etwas anderen Einschätzungen.
Es wäre etwas unfair, KI-generierte Bilder mit Verweis auf die Werke anerkannter Künstler abzuwerten; schließlich stecken die KI-Systeme trotz beeindruckender Ergebnisse eigentlich noch in den Kinderschuhen.
Grafik: Doc Baumann mit AdobeFirefly und Photoshop
Die Videosequenz auf YouTube ist kurz und besteht nur aus ein paar Sätzen. Sie können sie sich also schnell anhören; der Einfachheit halber habe ich den Text hier noch einmal mitgeschrieben:
„Im Alltag helfen neue KI-Programme, auch die zur Bildbearbeitung wie Adobe, Dall·E, Bing oder Midjourney. Die Oberflächen brillieren, und Künstler hätten früher Tage und Wochen dafür gebraucht. Aber genau wie bei textbasierten KIs à la ChatGPT stoßen wir unter der glänzenden Verpackung bald schon auf völlig mittelmäßige, nach Schema ablaufenden Geschichten. Die aber werden immer mehr und mehr und fluten unser Bewusstsein, weil es immer leichter wird, sie herzustellen. Jeder kann das, der den richtigen Prompt findet. Und für Mittelmaß findet sich immer ein Prompt. Es wird die Zeit kommen, in der das Coolste die Reduktion auf das Wenige sein wird. Die Konzentration auf die Essenz und gar nicht so glänzend. Und diese Essenz zu erkennen bedeutet, selber denken, selber handeln, und selber leben zu müssen. Am Ende schreibst du allein den Prompt deines Lebens.“
Ich möchte vorausschicken, dass ich Gert Scobel und seine Wissenschaftssendungen sehr schätze und fast regelmäßig auf 3sat anschaue. Sein Themenspektrum ist sehr breit, und ich bin beeindruckt, wie er es schafft, sich immer wieder in weit auseinanderliegende Themen einzuarbeiten und dazu kluge Fragen zu stellen. (Man möge dies nicht als heimtückisch-freundliche Feststellung missverstehen, dass er nicht wirklich in allen diesen unterschiedlichen Bereichen eine hohe Kompetenz haben kann. Das wäre in der Tat zu viel verlangt. Und so kann ich in diesem besonderen Fall nicht beurteilen, wie groß die Menge KI-generierter Bilder ist, die er bisher angeschaut hat und die die Basis seiner Aussagen dafür liefern. Aber als Philosoph wird er sich schon genau überlegt haben, was er öffentlich sagt, und daher sollte man vorurteilsfrei schauen, ob man etwas daraus lernen kann.)
Seine ersten beiden Sätze sind zweifellos richtig (auch wenn Adobe kein Programm ist und man darüber streiten könnte, ob KI-Modelle wie Adobe Firefly Programme sind). Ja, es stimmt, dass visuell überzeugende – vielleicht mitunter gar erschlagende – Bildergebnisse entstehen und dass Künstler früher sehr lange gebraucht hätten, um so etwas manuell entstehen zu lassen.
Allerdings haben wir da schon den ersten Punkt, um einzuhaken. Der Verweis auf menschliche Künstler als Vergleichssubjekte impliziert, dass es sich bei (allen) KI-Bildern um Kunstwerke handelt. Phänomenologisch beschrieben handelt es sich aber zunächst einmal lediglich um Bilder. Niemand würde behaupten, das in seinem folgenden Satz erwähnte ChatGPT produziere literarische oder poetische Kunstwerke. Es produziert Texte. Die sind jedenfalls grammatisch und von der Rechtschreibung her fast immer korrekt, was man von denen menschlicher Schreiber nicht unbedingt behaupten kann. Selbstverständlich ist nicht auszuschließen, dass in einem Blindtest ein Chat-GPT-Text als sprachliches Kunstwerk bewertet würde. Das lässt aber nicht den Schluss zu: KI-generierte Werke sind Kunst, sondern nur: Es gibt einige KI-generierte Werke (Bilder, Texte, Musikstücke …), die als Kunstwerke rezipiert werden können.
Scobel bezeichnet solche KI-Ergebnisse als „völlig mittelmäßige, nach Schema ablaufende“ Werke. In dieser Aussage stecken gleich zwei Probleme:
Vielleicht kennen Sie die statistisch-psychologische Beobachtung, dass die meisten Autofahrer sich in ihrer Selbsteinschätzung für überdurchschnittlich gute Fahrer halten. Nehmen wir an, es gäbe eine klare Mess- und Testskala, was die Qualität eines Fahrers ausmacht (von miserabel bis hervorragend in zehn Stufen), dann liegt es auf der Hand, dass die meisten irgendwo in der Mitte einer Gaußschen Verteilung lägen, jedenfalls nicht alle überdurchschnittlich gut sein könnten.
Spricht man von mittelmäßigen Werken, so setzt man implizit eine solche Skala auch für Kunstwerke (bleiben wir der Einfachheit halber bei diesem Begriff) voraus. Nehmen wir hier ebenfalls eine Gaußsche Verteilung an, so liegt es auf der Hand, dass der größte Teil der Kunstwerke irgendwo im Bereich der Standardnormalverteilung zu finden sein muss. Über ein Kunstwerk zu sagen, es sei mittelmäßig, sagt daher nicht viel aus, sondern ist einfach zu erwarten. Es gibt eine kleine Anzahl von Werken, die als hervorragend eingeschätzt werden, und sicherlich ebenso viele, wahrscheinlich aber weitaus mehr, die schlecht und peinlich sind. Mittelmäßigkeit liegt irgendwo dazwischen und ist das, was wir wahrscheinlich zu erwarten haben, wenn wir ein x-beliebiges Stück mit verbundenen Augen aus einem Sack ziehen.
Das zweite Problem besteht darin, dass die Einschätzung KI-generierter Bilder als mittelmäßig – wiederum implizit – voraussetzt, das sei eine Besonderheit von KI-Bildern, die sie von Bildern anderer Art, nämlich gänzlich menschengemachten, unterscheidet. Nun muss man sich aber nur einmal beliebige Kunstausstellungen anschauen, die nicht in den wenigen großen Museen stattfinden, sondern in kleinerem, regionalem Rahmen, um schnell zu der Einschätzung zu gelangen, dass auch hier das Mittelmaß vorherrscht – je nach Bewertungskriterien eher im linken Teil der Gaußkurve angesiedelt.
Nun könnte man einwenden: Geschenkt! Wissen wir doch! Den Maßstab bilden eben nur diejenigen Werke, die von kompetenten Fachleuten als wirklich richtungsweisende Kunstwerke eingeschätzt werden. (Nein, ich werde jetzt nicht schreiben, damit vergliche man Äpfel mit Birnen, weil entgegen einem weitverbreiteten Missverständnis der Vergleich von Äpfeln und Birnen durchaus legitim ist. So sind etwa die einen rund und die anderen, na ja, eben birnenförmig. Was mit der Zurückweisung eigentlich gemeint ist, ist nicht der Vergleich, sondern die Gleichsetzung.) Wie auch immer, es ist nicht legitim, nur den am höchsten bewerteten Sektor als Maßstab zu nehmen. Wenn schon, dann müsste man eine solche Vorauswahl auch bei den KI-Bildern treffen.
Hinzu kommt eine weitere Schwierigkeit, die Berücksichtigung der ästhetischen und handwerklichen Produktionserfahrung. Wir empfänden es als unfair, Gemälde einer Hobbykünstlerin, die sich seit ein, zwei Jahren mit dem Malen beschäftigt, eins zu eins mit denen eines kunstakademiestudierten Menschen in Beziehung zu setzen, der das seit Jahrzehnten betreibt und am Kunstmarkt hohe Preise erzielt. Ebenso unfair ist es, hoch bewertete Menschen-Bilder mit KI-generierten auf eine Stufe zu stellen, deren Modelle erst ein, zwei Jahre alt sind und zudem kontinuierlich besser werden. Doch wenn man diese Gleichsetzung tatsächlich vornähme, müsste man zugestehen, dass die technische und ästhetische Qualität der KI-Werke schon nach dieser kurzen Trainingszeit weit über der menschlicher Akteure mit ähnlichem Hintergrund liegt.
Kurzum: Scobels Vorwurf des Mittelmaßes ist unangebracht und sagt nichts über die spezifische ästhetische Qualität von KI-Bildern aus. Dass er im Folgesatz feststellt, sie seien immer leichter herzustellen, stimmt natürlich – aber das ist dieselbe Kritik, die Mitte des 19. Jahrhunderts Maler und Zeichner an den Fotografen übten. Dass etwas leicht(er) herstellbar ist, kann kein negatives ästhetisches Kriterium sein, höchstens ein positives ökonomisches.
Und dass das jeder kann, der den richtigen Prompt findet, ist ebenso unspezifisch. Denn erstens, was ist dieses „das“ überhaupt? Angenommen, wir wüssten es: Was wäre daran auszusetzen, dass es jeder kann, der den richtigen Prompt findet? Und drittens: Gerade das Finden des „richtigen Prompts“ ist ja eine gar nicht so einfache Angelegenheit, wie jeder weiß, der nach zahlreichen Umformulierungen noch immer nicht das Bild generiert findet, das er im Kopf hat, trotz vermeintlich exakter Beschreibung. Wenn ich beim Bäcker in meinen Bart nuschele, ich wollte irgendwas Gebackenes haben, darf ich mich nicht wundern, wenn mir die Verkäuferin etwas auf den Tresen legt, das ich gar nicht haben wollte.
Ob, wie von Scobel prophezeit, der Tag kommen wird, an dem das Coolste die Reduktion sein wird, die Konzentration auf die Essenz, sei dahingestellt. Prophezeiungen sind bekanntlich schwierig, vor allem, wenn sie die Zukunft betreffen. Aber wenn es so kommen sollte – warum nicht? Das ist aber kein Argument gegen die Qualität heutiger KI-Bilder, auch die wird sich weiterentwickeln. Dass es Prompts fürs Mittelmaß gäbe, ist daher nicht einmal falsch, sondern aussagelos. Vor allem ist es polemisch. Außerdem fehlt mir bei dieser Verdammung ein wenig Respekt und Bewunderung dafür, was KI-Systeme leisten; schon heute mit einer Perfektion, die ohne Kenntnis der Entstehungsgeschichte kaum noch Aussagen darüber zulässt, ob mensch- oder maschinengemacht. Das schließt ja nicht aus, gleichzeitig Befürchtungen zu hegen, welche gefährlichen Potenzen in KI stecken. Küchenmesser sind ein unentbehrliches Utensil beim Kochen – wir verzichten nicht auf ihren hilfreichen Einsatz, weil man sie zweckentfremdend auch in Menschen stecken könnte, mit tödlichem Ausgang.
In der aktuellen DOCMA zeige ich, dass selbst promptlose Bilder durchaus wie (vielleicht sogar als) Kunstwerke rezipiert werden können, und in der nächsten, dass selbst ein simpler Prompt wie „Franz Kafkas Träume“ zu höchst eindrucksvollen Ergebnissen führen kann, die man bei menschlichen Urhebern ohne Weiteres als kreativ und originell bezeichnen würde. Es gibt also keine Prompts fürs Mittelmaß.
Und die beiden letzten Sätze? „Und diese Essenz zu erkennen bedeutet, selber denken, selber handeln, und selber leben zu müssen. Am Ende schreibst du allein den Prompt deines Lebens.“ Klingt erst mal gut und tiefschürfend. Solange man es nicht auseinandernimmt. Dass es sich auf Kants Aufsatz „Was ist Aufklärung?“ bezieht, macht die Sache nicht besser. (Dessen Argumente sind leider in heutigem Umfeld so allgemein und unscharf interpretierbar, dass die Forderung des „selber Denkens“ problemlos auch auf Transparenten bei den Demos sogenannter Corona-Skeptiker auftauchen konnte.)
Zunächst einmal hat diese Aufforderung mit dem zuvor Gesagten gar nichts zu tun, außer dem etwas mühsam übertragenen Begriff „Prompt“. Die Feststellung, am Ende schreibe man selbst diesen Prompt für das eigene Leben, hört sich zwar prima an und gibt vielen Heutigen wohl eine leichter nachvollziehbare Orientierung als solche, die auf klassische philosophische Denkgebäude gegründet sind. Bei Lichte betrachtet möchte man freilich die eigene Lebensplanung nicht gern so ungenau umgesetzt sehen, wie das beim Verhältnis von beschreibendem Prompt und KI-generiertem Bild derzeit noch der Fall ist. Aber zugegeben – es klingt sehr eindrucksvoll und zeitgemäß.
Und noch etwas: Der ins Video eingeblendete Text „Hört auf, eure Daten zu verschenken!“ greift etwas kurz, obwohl er in anderem Zusammenhang einen durchaus richtigen Kern hat. Wenn ich ChatGPT oder KI-Bildgenerierer benutzen möchte, sollte ich mich nicht beklagen, wenn zu deren Training auch Material von mir verwendet wird. Über die Art und Weise, wie diese Nutzung aussieht, haben viele wohl falsche Vorstellungen. Diese Ablehnung erinnert mich an Menschen, die vehement für die Energiewende eintreten, aber bitteschön kein Windrad in Sichtweite haben möchten.
Die nächste Sendung von Gert Scobel werde ich mir trotzdem gern wieder anschauen; da ist er überzeugender als in diesem etwas aufgeregten Videoschnipsel.
Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.
Sehr geehrter Doc Baumann,
Zu ihrem Artikel über Sockel und KI:
Erstmal – lieber Doc – kann ich Ihre Kritik (die ich sonst sehr zu schätzen weiß) nicht ganz nachvollziehen. Ist die Beschreibung von Scobel wirklich so falsch?
Na klar, die Bilder die durch KI-Prompt entstehen sind oft erstaunlich, aber auch genauso oft zu gut um wahr zu sein. Also, warum nicht „mittelmäßig“ stehen lassen…?
Liefert eine wirklich kritische Perspektive auf KI, denn so wenig Angriffspunkte, dass der Herr Scobel nun herhalten muss?
Ich habe nun – gefühlt – unendlich viele Beiträge über KI gehört, gelesen und gesehen und zitiere mal Max Liebermann: „Ick kann jarnicht so viel fressen, wie ick kotzen möchte“.
Da wird das Thema KI hochgejazzt, daß einem hören und sehen vergeht. Jede Menge „Fachleute“ werden von jeder Menge Journalisten zu KI hier und da befragt (alle Sparten in allen Medien müssen scheinbar darüber berichten). Diese Experten äußern sich in überwiegender Zahl geradezu euphorisch über die vermeintlichen Möglichkeiten die sich der Menschheit mit dieser Technologie eröffnen. Die meisten dieser Experten wollen in naher Zukunft schon unanständig viel Geld mit diesem heißen Scheiß verdienen, genauso wie alle Firmen die Programme und Algorithmen entwickeln. Nachdem jede Menge Raum für KI-Lobhudelei geöffnet wurde, folgt immer zum Ende noch die Frage nach den Risiken, die immer verharmlost werden. Da sind Moderatoren wie Scobel, die ihr bestes geben, um da mal hinter die Fassade zu schauen, doch eher lobenswert unverdächtig.
Worüber reden wir hier?! Über Bildchen! Die KI kosten ja nur ein paar Zehntausend Fotografen, Grafikern und Designern, usw, die Existenz (und übrigens auch noch Hunderttausend /Millionen aus anderen Berufsgruppen) und DOCMA demonstriert an Beispielen, wie manipulierte/manipulative Bilder im Nahostkonflikt die Stimmung anheizen.
Wenn KI nicht hauptsächlich zu Manipulation von Käufern, Wählern in demokratischen Systemen, zur Steuerung von Killerdronen usw, sondern zur Beseitigung von Hatespeech im Internet und, vor Allem zu 90% zur Rettung unserer Umwelt beitragen, dann (und nur dann)– Hey! – bin ich wieder dabei.
Zuerst sollten die Computer alles besser und schöner machen. Dann sollte das Internet das selbe bewirken und jetzt soll die KI die letzte Verteidigungslinie sein. Alles nur die Verantwortlichkeitsverschibung der Menschen, die sich NICHT mit den drängenden Problemen beschäftigen WOLLEN. Und mindesten 3 Millarden Menschen wollen den ganzen Tag nur aufs Smarty glotzen und Spaß haben.
Was will der Autor (ich) eigentlich sagen…?
Dieser Artikel über unzureichender Wortwahl von Herr Scobel scheint mir – im Schein existentieller Probleme – (mehr als) seltsam aus der Zeit gefallen. Und das, obwohl auch dieser KI-Artikel nur hip sein will.
Sehr geehrter Herr Baumann, ich habe sehr viele Ihrer Artikel gelesen und meistens gehöre ich zu den Lesern, die Ihrer Meinung zustimmen und zu schätzen wissen, aber ich sehe DOCMA – mit der Flut an KI-Material – irgendwie auf dem falschen Werg. Meine Meinung!!!
Aber, wer bin ich schon…? 2 Jahrzehnte Fotograf – aufgegeben. 1 Jahrzehnt EBV und DTP/CGI – aufgegeben. Letztes Jahrzehnt alles mögliche…
Ca. 2015 sagte Anton Corbijn (berühmter Fotograf/Regisseur): „… noch nie war Fotografie so populär und noch nie so wenig wert…“. Dieses Zitat kann man jetzt auf so viel andere Gebiete ausweiten (inkl. der Natur).
Nur weiter so…
MfG
Sorry, Fehlerteufel Schreibkorrektur: Scobel heißt natürlich nicht Sockel. Peinlich! aber gutes Beispiel für Technik die helfen soll und Gegenteil macht…
Wir liegen doch gar nicht so weit auseinander. Ich stimme Ihnen weitgehend zu: Es geht nicht um Kunst, sondern eben um … Bildchen (wobei ich schon sagen würde: Bilder). Gestört hat mich, dass Herr Scobel die aber eben an anerkannten Kunstwerken misst und dann zum Ergebnis kommt, sie seien mittelmäßig – was aber wenig über KI aussagt, da auch menschgemachte Bilder überwiegend mittelmäßig sind.
Was den Missbrauch von KI-Bildern zum Zwecke der Manipulation angeht, hat es Olaf Giermann doch deutlich beschrieben: Da gibt es keinen grundsätzlichen Sprung von digitalen Montagen zu KI-Bildern. Also ist KI hier der falsche Adressat.
Und bitte keine Unterstellungen! Ich habe nicht den Anspruch, „hip“ zu sein, sondern das war eine ersthafte Antwort (auf philosophischer Basis) auf den Einwurf eines Philosophen. Ernsthafte Philosophie ist selten „hip“.
Mein Text hatte ein Thema, und da ist es sinnlos, darüber zu lamentieren, dass er sich nicht auch zu anderen Themen geäöußert hat. Wenn ich über Photoshop schreibe, reflektiere ich auch nicht die ganze aktuelle Weltpolitik (was auch niemand erwartet).
Aber, wie ich schon öfters schrieb: Die ganze KI-Bilder-Diskussuon erinnert sehr stark an die Argumente und Ängste von Malern und Zeichnern beim Aufkommen der Fotografie im 19. Jahrhundert. Und – hat’s was gebracht? Haben Sie ein schlechtes Gewissen, weil Sie als Fotograf den Malern und Zeichnern ihre Jobs weggenommen haben? Diese Fragen stellen sich doch gar nicht mehr. Ob DOCMA nun dafür oder dagegen ist, ändert überhaupt nichts. KI wird die Welt verändern, zum Guten wie zum Schlechten. Man kann das beklagen, aber das wird nichts bewirken. Also bleibt nur, daraus das Beste zu machen.
Sehr geehrter Herr Baumann,
es war jetzt nicht meine Absicht Sie mit einer Unterstellung in die Ecke zu stellen („hip“).
Ich entschuldige mich aber aufrichtig, wenn ich Ihnen zu nahe getreten bin!
Nun gut… Es ist passiert und ich betrachte Ihren Artikel NUR im Kontext des Tsunamis an Artikeln und Sendungen zum Thema KI.
In Anbetracht Ihres umfassenden Wissens will ich mich auch auf keinen Fall mit Ihnen messen.
Aber, ich bleibe meiner Meinung treu.
Gut – Herr Scobel hat zum Vergleich „anerkannte“ Kunstwerke herangezogen. Das halte ich für legitim. Warum soll man auch mit schlechten,
NICHT anerkannten Werken vergleichen? Soll man zum Vergleich Kinderzeichnungen nehmen…?
Und dann natürlich Ihr Vergleich mit dem 19. Jahrhundert – Fotografie gegen Malerei.
« Die Fotografie ist der Todfeind der Malerei, sie ist die Zuflucht aller gescheiterten Maler, der Unbegabten und Faulen. » Charles Baudelaire (1821—1867)
Diese Faulen haben riesige Gerätschaften bedient und durch die Gegend geschleppt, um dann darauf tagelang in der Dunkelkammer, mit teils gesundheitsschädlichen Umgebungen, ihre Ergebnisse zu erzeugen. Und richtige Konkurrenz war die Fotografie erst mal nur im Bereich Portrait.
Also sorry Herr Baumann, Baudelaires Angriff auf die Fotografen hat damals gehinkt, trifft auf die Prompter definitiv zu.
Man gibt in eine Komandozeile auf einer Plattform im Internet ein paar Begriffe ein, und die KI plündert dann das Internet nach „Werken“ die passen können, vielleicht kann man noch ein Bild dazu laden (gehört das auch dem Auftraggeber?) und wartet auf ein Ergebnis (ein paar Minuten) und simsalabim ist die Raubkunst (ich kenne den eigentlichen Zusammenhang dieses Begriffes) fertig. Ist das Kreativität und Arbeit?! „… Oh…! Dieses Ergebnis hätte ich aber nicht erwartet! Das sieht echt toll aus…! Das nehme ich. Was bin ich für ein toller Künstler!“
Lächerlich! und viele andere despektierliche Begriffe…
Fotografen wie ich haben Tage, Wochen und Monate an Projekten gebastelt um dann Tage, Wochen und Monate in der Dunkelkammer Abzüge anzufertigen.
Da war letztens ein Fotograf (Name vergessen) der bei einem Fotowettbewerb den ersten Platz gemacht hätte, diesen Preis aber abgelehnt hat, weil mit KI erzeugt. Keine Ahnung, warum man dann erst teilnimmt, aber immerhin ehrenwert. Wenn sich ein Künstler/rin eine eigene KI entwickelt UND dann eigene Vorlagen (Bilder/Malerei) verwendet, ist das für mich auch okay. Ein richtiger Schaffensprozess. Und – NEIN! – ich lehne nicht jede neue Technologie ab und weiß auch über die Chancen: Medizin, Archäologie und Sicherheit….
Und dann Ihr Todschlagargument: Es ist nun mal in der Welt – so what…?
Mir gefällt Ihre Ergebenheitsgeste und Ihre Kapitulation vor einer potentiell gefährlichen Technologie nicht!
Das muss Sie aber nicht tangieren…
Danke für Ihre Antwort/Stellungnahme!
MfG
„Da war letztens ein Fotograf (Name vergessen) der bei einem Fotowettbewerb den ersten Platz gemacht hätte, diesen Preis aber abgelehnt hat, weil mit KI erzeugt. Keine Ahnung, warum man dann erst teilnimmt, aber immerhin ehrenwert.“
Boris Eldagsen (das war der gesuchte Name) hat begründet, warum er am Wettbewerb teilgenommen und seinen Preis dann abgelehnt hat: „Thank you for selecting my image and making this a historic moment, as it is the first AI generated image to win in a prestigious international PHOTOGRAPHY competition. How many of you knew or suspected that it was AI generated? Something about this doesn’t feel right, does it? AI images and photography should not compete with each other in an award like this. They are different entities. AI is not photography. Therefore I will not accept the award.
I applied as a cheeky monkey, to find out if the competitions are prepared for AI images to enter. They are not.
We, the photo world, need an open discussion. A discussion about what we want to consider photography and what not. Is the umbrella of photography large enough to invite AI images to enter – or would this be a mistake? With my refusal of the award I hope to speed up this debate.“ (https://www.eldagsen.com/sony-world-photography-awards-2023/ ; ich habe ein paar Tippfehler korrigiert.)