BlogFotografieKIWissen

Samsung: Ein echtes Bild gibt es nicht

Diskussion über KI-Funktionen im Galaxy S24

„Eigentlich gibt es so etwas wie ein echtes Bild nicht“, erklärte kürzlich ein Sprecher von Samsung. Es ging darum, ob die KI-Funktionen im neuen Galaxy Smartphone die Wiedergabe der aufgenommenen Realität verfälschen oder nicht. Wenn es ohnehin keine echten Bilder gäbe, wäre das keine Frage von ja oder nein, sondern eine von mehr oder weniger. Doc Baumann, der zum Thema Bildbegriff seine Doktorarbeit verfasst hat, sollte es eigentlich wissen.

Selfie, gefiltert | Doc Baumann mit Deep Dream Generator, Prompt »professional sharp photo taken from the backside, head and shoulders of an old grey haired woman with wrinkles seen from behind, looking at her smartpone with the face of a very beautyful young woman«

Die Sache ist nicht so einfach, wie es auf den ersten Blick scheint. Schauen wir uns also zunächst einmal an, was da überhaupt im Interview von Patrick Chomet, Samsung Executive Vice President (EVP) für Produktinnovationen, genau gesagt wurde.  Den englischen Originalwortlaut finden Sie hier (https://www.techradar.com/phones/samsung-galaxy-phones/there-is-no-such-thing-as-a-real-picture-samsung-defends-ai-photo-editing-on-galaxy-s24).

„Es gab letztes Jahr ein sehr schönes Video von Marques Brownlee über das Mondbild“, erinnerte sich Chomet. „Alle fragten sich, ,Ist es fake? Ist es nicht fake?’“

Kurze Unterbrechung: „Das Mondbild“ bezieht sich auf ein Video, in dem die zunächst undifferenziert helle Scheibe des Vollmonds plötzlich durch ein scharfes Bild des Mondes mit seinen dunklen Flecken ersetzt worden war). (https://www.techradar.com/phones/samsung-galaxy-phones/there-is-no-such-thing-as-a-real-picture-samsung-defends-ai-photo-editing-on-galaxy-s24)

„Es gab eine Debatte darüber, was ein echtes Bild ausmacht. Und eigentlich gibt es so etwas wie ein echtes Bild nicht. Sobald Sie Sensoren haben, um etwas zu erfassen, reproduzieren Sie [was Sie sehen], und das bedeutet nichts. Es gibt kein echtes Bild. […] Sie können versuchen, ein echtes Bild zu definieren, indem Sie sagen: ,Ich habe dieses Bild gemacht‘, aber wenn Sie KI verwendet haben, um den Zoom, den Autofokus, die Szene zu optimieren – ist es echt? Oder sind es alles Filter? Es gibt kein echtes Bild, Punkt.“

„Aber dennoch sind Fragen zur Authentizität sehr wichtig“, fuhr Chomet mit Bezug auf die generativen KI-Funktionen der Galaxy S24-Smartphones fort, „und wir [Samsung] erkennen zwei Verbraucherbedürfnisse; zwei unterschiedliche Kundenabsichten. Keine davon ist neu, aber generative KI wird eine davon beschleunigen.

Eine Absicht besteht darin, den Moment festzuhalten – ein Bild aufzunehmen, das so genau und vollständig wie möglich ist. Um das zu erreichen, verwenden wir viele KI-Filter, Modifikationen und Optimierungen, um Schatten, Reflexionen und so weiter zu entfernen. Aber wir unterstützen die Absicht des Benutzers, die darin besteht, diesen Moment festzuhalten.

Dann gibt es eine andere Absicht, nämlich etwas zu erschaffen. Wenn Leute auf Instagram gehen, fügen sie eine Menge cooler Schwarz-Weiß-Sachen hinzu – sie kreieren eine neue Realität. Ihre Absicht besteht nicht darin, die Realität nachzubilden, sondern etwas Neues zu schaffen. Also [Generative Bearbeitung] ist keine völlig neue Idee. Generative KI-Tools werden diese Absicht in den nächsten Jahren exponentiell beschleunigen […] daher gibt es ein großes Kundenbedürfnis, zwischen dem Echten und dem Neuen zu unterscheiden. Deshalb fügt unser Generative Bearbeitungsfeature ein Wasserzeichen hinzu und bearbeitet die Metadaten, und wir arbeiten mit Regulierungsbehörden zusammen, um sicherzustellen, dass die Menschen den Unterschied verstehen.“

In Bezug auf die KI-Regulierung sagte Chomet, dass Samsung „ganz auf einer Linie mit den europäischen Vorschriften zur KI“ liege und wies darauf hin, dass Regierungen das Recht haben, frühzeitig Bedenken hinsichtlich der potenziellen Auswirkungen der weit verbreiteten KI-Nutzung zu äußern. „Die Branche muss verantwortungsbewusst handeln und reguliert werden“, fügte Chomet hinzu und ergänzte, dass Samsung aktiv daran arbeite. „Unsere neue Technologie ist erstaunlich und leistungsstark – aber wie alles kann sie auf gute und schlechte Weise verwendet werden. Daher ist es angemessen, über die schlechten Wege nachzudenken.“

 

Was ist ein Bild?

„Eigentlich gibt es so etwas wie ein echtes Bild nicht“, sagt Chomet. Um zu klären, ob das stimmt oder nicht, müssen wir zunächst bestimmen, was ein Bild überhaupt ist. Da ich ein ganzes Buch dazu geschrieben habe, ist es nicht einfach, es in ein paar Sätzen zu erklären. Ein Bild ist etwas, das aussieht wie etwas anderes, das nicht es selbst ist, kann man als erste Näherung sagen. Früher hätte man allgemeiner behauptet, es sei ein Objekt beziehungsweise dessen Oberfläche, die aussieht wie etwas anderes. Aber seit es Monitore gibt, wäre das zu ungenau, denn das Bild auf einem Bildschirm ist kein Objekt, und das Objekt „Bildschirm“ kann nicht nur ein Bild zeigen, sondern zahllose. Daher allgemeiner: „etwas“.

Natürlich ist nicht alles, das aussieht wie etwas anderes, dessen Bild. Ein Blatt an einem Baum ist nicht das Bild des Blattes daneben, und ein Zwilling nicht das Bild seines Bruders, selbst wenn beide genau gleich aussähen. Obwohl auch das nicht ganz stimmt, kann man sagen, wichtig dafür, dass etwas das Bild von etwas anderem sein kann, ist die Ähnlichkeit zwischen beiden, und zwar nur die visuelle. Das Bild kann also kleiner oder größer sein als das Abgebildete, grau statt farbig, flach statt räumlich ist es definitionsgemäß; es muss auch nicht jedes Detail wiedergeben, sondern nur so ähnlich sein, dass es als Bild von etwas erkannt wird. Ein naturgetreues Bild – und nur um die geht es hier – ist also immer ein Bild von etwas.

Unser Alltagssprachgebrauch unterscheidet nicht zwischen „Dies ist ein Bild von Frau Mustermann“ und „Das Bild von Frau Mustermann ist von der Wand gefallen“, obwohl „Bild“ in beiden Sätzen etwas ganz anderes bedeutet. Im ersten Satz meint es die unserer visuellen Wahrnehmung zugängliche Erscheinung von etwas, das in der Regel nicht selbst anwesend ist. Im zweiten Satz meint es einen Gegenstand, der zwar seiner besonderen Oberfläche wegen bemerkenswert ist, aber behandelt werden kann wie jeder andere Gegenstand; man könnte ihn zum Beispiel schützend vor ein Fenster stellen, dessen Scheibe zerbrochen ist.

Zur klareren Unterscheidung nennt man das Bild im zweiten Satz „Bildträger“, und so könnte man im weiteren Sinne auch den Monitor benennen, der uns ein Bild zeigt. Diesen Gegenstand gibt es, völlig unabhängig davon, ob ihn sich jemand anschaut oder nicht. Nehmen wir an, wir hätten ein Papierfoto eines geliebten Menschen bei einer Wanderung im dichten Wald verloren, wo es niemand jemals wieder sehen würde. Diesen Bildträger gibt es so lange, bis er zerfällt. Das Bild, das er erscheinen lässt, gibt es dagegen nicht mehr, einfach deswegen, weil niemand da ist, der den Bildträger anschaut. Das Bild gibt es also nur dann und nur so lange, wie ein Betrachter es sieht – schaut er weg, ist da nur noch der Gegenstand „Bildträger“ mit ein paar hellen und dunklen Flecken darauf.

Was zeigt dieses Foto? Es dauert einen Augenblick, bis man das Motiv erkennt. Hielte man es als Ausdruck in der Hand, hätte man es mit genau demselben Bildträger zu tun wie in der folgenden Abbildung, die richtig herum präsentiert wird und daher schnell und einfach erkannt wird. Wir haben es also mit nur einem Bildträger zu tun, aber dennoch mit zwei Bildern. | Foto: Doc Baumann

 

Das Bild als Erscheinung des Abgebildeten

Diesen Gegenstand kann Patrick Chomet also nicht meinen, denn dass es den milliardenfach gibt, lässt sich nicht leugnen. Ebenso gibt es ungeheure Mengen von Bildern, deren Existenz sich ebenso wenig bestreiten lässt. Gemeint sein kann also nur: Es gibt kein Bild, welches das von ihm Abgebildete echt (völlig getreu) wiedergibt. Das betrifft auch nicht die Frage der fotografischen – oder gar künstlerischen – Subjektivität, also die Wahl von Brennweite, Verschlusszeit, Standort, Zeitpunkt … Man könnte auch ein selbstfahrendes Auto allein losschicken, eine Kamera aufs Dach montieren und sie in zufallsgesteuerten Abständen Fotos aufnehmen lassen. Auch dafür und unabhängig von einem Subjekt mit einer Abbildungsabsicht würde Chomets Behauptung gelten, es gäbe keine echten Bilder.

Wie aber würde ein echtes Bild aussehen, wenn es dieses gäbe? Es würde genau das zeigen, was wir sähen, wenn unser Auge an der Stelle des Sensors wäre (oder früher des Films).

Doch was wir sehen, ist nicht allein eine Frage der Optik aufgrund der Ähnlichkeit von Auge und Kamera (obscura). Bereits in der Netzhaut des Auges gibt es Verrechnungsprozesse, etwa die laterale Inhibition, die ziemlich genau dasselbe macht wie ein Bildbearbeitungsprogramm beim Schärfen. Es geht nicht um den optischen Reiz, sondern um das, was wir von unserer Umwelt wahrnehmen, und bis es dazu kommt, haben die visuellen Signale viele Stationen im Gehirn durchlaufen, die sie filtern, abstrahieren, vereinfachen, vergleichen, mit Emotionen und Erinnerungen anreichern, bis uns schließlich das Gesehene bewusst wird.

Zudem können wir nur bestimmte Wellenlängen des Lichts wahrnehmen und sehen nicht im Infrarot oder Ultraviolettbereich. Manche Tiere können das und sehen folglich eine andere „Welt“, andere haben eine weit größere Sehschärfe als wir. Vielleicht wird irgendwann die Sehschärfe und Auflösung von Digitalkameras die unseres Auges übertreffen, aber das ändert nichts an der Funktion von Bildern.

Die Frage müsste also bereits sein, ob das von uns Wahrgenommene überhaupt das „echte Bild“ der Welt ist. Aber womit sollten wir es vergleichen? Besser wäre wohl eine Konstellation, bei der wir eine Szene sowie ein Bild dieser Szene betrachten und einen ähnlichen, im Grenzfall gleichen Seheindruck erleben.

Ein Film oder ein Sensor hat in der Regel einen geringeren Kontrastumfang als das von uns Wahrgenommene (wobei zu berücksichtigen ist, dass wir nicht starr an eine Stelle schauen, sondern unsere Augen sich bewegen und unterschiedliche Bereiche abtasten). Wenn also zum Beispiel HDR-Techniken eingesetzt werden, womöglich bereits in der Kamera, dann ist das einerseits eine nachträgliche Manipulation des aufgenommenen Bildes, andererseits liefert das Verfahren aber ein Bild, das unserer Wahrnehmung näher ist als das unbearbeitete Foto. Für die genannten Faktoren Zoom oder Autofokus trifft das erst recht zu. Dass der per KI hinzugefügte Mond im oben erwähnten Video nicht „echt“ ist, ist eine Sache – wenn wir in der Nacht zu ihm aufblicken, erscheint er uns aber nicht als helle, überbelichtete Scheibe, sondern wir erkennen Oberflächendetails. Das digital und per KI bearbeitete Bild kann also näher an unserer Wahrnehmung einer Szene sein als das unbearbeitete.

 

Naturtreue und Idealisierung

Auf andere Filter, die Pickel und Falten entfernen und Porträts automatisch gängigen Schönheitsidealen anpassen, trifft das natürlich nicht mehr zu. (Oder besser: wahrscheinlich – denn wir wissen ja zum Beispiel, dass Verliebte das Objekt ihrer Begeisterung tatsächlich anders „sehen“ als Außenstehende und eventuelle Mängel „wegfiltern“.) Ist der Bezugspunkt also nicht die bloße Optik, sondern das Ergebnis des komplexen Wahrnehmungsprozesses, könnten vielleicht sogar solche Filterungen als Grenzfall „echter Bilder“ gelten.

Letztlich stellt Chomet zwei Positionen gegenüber, die die Diskussionen über Bilder (als Kunstwerke) bereits jahrhundertelang beherrscht haben: Das Bild als getreue Widerspiegelung und Repräsentation der „Natur“ auf der einen Seite – das Bild als Wiedergabe des Idealen auf der anderen Seite.

Beides lässt sich am Beispiel des antiken Malers Zeuxis von Herakleia verdeutlichen: Bei einem Wettstreit mit seinem Kollegen Parrhasios malte er Trauben so täuschend naturgetreu, dass Vögel herbeikamen, um an ihnen zu picken. Dennoch verlor er, denn als er das Gemälde später betrachtete, hing ein Schleier darüber, der es verdeckte. Zeuxis wollte ihn zur Seite schieben – und merkte erst jetzt, dass Parrhasios diesen nur gemalt hatte. So hatte Zeuxis zwar die Tauben getäuscht, Parrhasios aber sogar seinen menschlichen Rivalen.

Die zweite Geschichte von Zeuxis berichtet vom Gegenteil, der Idealisierung: Der Maler war von der Stadt Kroton beauftragt worden, für den dortigen Tempel der Hera ein Bild der Helena zu malen. Da diese als Inbegriff idealer Schönheit galt, gab sich Zeuxis nicht mit einem Modell zufrieden, sondern ließ die fünf schönsten jungen Frauen der Stadt für sich posieren und wählte von jeder die idealen Körperteile – ein Verfahren, das man sich auch in Photoshop vorstellen könnte. (siehe auch: https://www.docma.info/blog/antike-montagetechnik)

Diese beiden Alternativen beschreibt Chomet mit seinen Worten so: „Eine Absicht besteht darin, den Moment festzuhalten – ein Bild aufzunehmen, das so genau und vollständig wie möglich ist“ entspräche dann dem Traubenbild. „Dann gibt es eine andere Absicht, nämlich etwas zu erschaffen“ – das entspräche hingegen dem Bildnis der Helena. Getreue Wiedergabe hier, Idealisierung dort.

So sinnvoll es ist, wenn Software und KI beide Varianten unterstützen, so wenig begründen sie den zentralen Satz, der für so viel Aufregung gesorgt hat: „Und eigentlich gibt es so etwas wie ein echtes Bild nicht.“ Denn ein solches „echtes“ Bild lässt sich letztlich gar nicht definieren. Auch ein verwackeltes Foto mit Farbstich ist ein „echtes“ Bild der aufgenommenen Szene, auf der Skala der Annäherung nur eben weiter von der perfekten 1:1-Übereinstimmung entfernt. Das ist nicht anders bei Gemälden oder Zeichnungen, die akzentuieren, weglassen, vereinfachen oder abstrahieren. Der nie erreichte Grenzwert wäre die vollkommene Übereinstimmung mit dem Seheindruck, nicht mit der Wirklichkeit, was weniger perfekte Bilder aber nicht davon ausschließt, ebenfalls „echt“ zu sein.

 

Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.

Zeig mehr

Doc Baumann

Doc Baumann befasst sich vor allem mit Montagen (und ihrer Kritik) sowie mit der Entlarvung von Bildfälschungen, außerdem mit digitalen grafischen und malerischen Arbeitstechniken. Der in den Medien immer wieder als „Photoshop-Papst“ Titulierte widmet sich seit 1984 der digitalen Bildbearbeitung und schreibt seit 1988 darüber.

Ähnliche Artikel

3 Kommentare

  1. „Eigentlich gibt es so etwas wie ein echtes Bild nicht“ … ist ein für die heutige Zeit typischer Satz. Klingt danach, als ob die Sprecherin oder der Sprecher alle Erkenntnisse der Menschehit in einen Satz packen kann, ist tatsächlich einfach nur Nichtssagend, eine leere Hülle, der eignetlich sogar die Hülle fehlt.
    Warum Nichtssagend ist in dem Blog in einigen wichtigen Fakten beschrieben worden.

  2. Sehr geehrter Herr Baumann,

    erstmal Respekt für die jahrzentelange Arbeit! Und die vielen Stunden die ich als Jugendlicher mit eurem Magazin verbracht habe!

    Mal Kurz; Vilém Flusser hat in meiner Gedankenwelt den Begriff der technischen Bilder eingeführt (ins Universum der technischen Bilder) Es gibt durchaus „echte“ Bilder, die sicher immer nur eine gerasterte, durch auflösung bestimmte 2dimensionale representationen ihres sujets sind; dennoch geht die entwicklung stetig weiter, auch das 3dimensionale Ab-Bild z.B. die Punktwolke mit Farbwertinformationen ist heutzutage im alltäglichen Gebrauch, vieler Anwender angekommen; Das technische Bild, z.B. Bildgebende Verfahren in der Medizin sind deswegen im evidenzbasierenden wissenschaftlichen Sinne echt, da sie reproduzierbar sind und die bedingungen klar definiert sind; Die Frage nach dem „echten“ Bild ist nicht mehr die Frage nach Autorentum; Es ist eine wiedergabe von, von sensoren in bestimmer auflösung aufgenommenen signalen in 2 oder 3d; Könnte man eine Photographie (Sensorbild) aufnehmen, das als auflösungsraster die planksche länge hätte, wäre das ab-bild so echt wie die realität selbst; natürlich nur hypothetisch;
    Die „Echtheit“ von Bildern kennt viele Möglichkeiten, klar die Photographie in dem sinne mit „licht zu schreiben“ ruft die debatte immer schnell auf; und ja, ich finde ein bild kann sehr echt sein; wenn der autor sich zurück nimmt und z.b. nur die reine, imterpretirbare, sensorinformation z.b. als *.raw teilt; so wie ein abzug eines analogen röntgengeräts verdammt echt ist; wenn man es eben nur als sensor, detektor, z.b. gravitationswellendetektor benutzt; das bild ist so echt wie sein informationsgehalt darstellen kann; Die Sensoren dazu ausgelegt wellen, teilchen, das faszinierende photon (in seinem dualismus) in signale umzusetzen die unsere maschinen und am ende wir interpretieren können;

  3. Achso eins fällt mir dazu noch ein: Die 4te Dimension; philosophisch würde ich sagen ein scanner der punktwolken(oder wellewolken, was weiß ich, ich bin nur kreativ aus prinzip) erzeugt in auflösung der plankschen länge, und wenn man das noch speichern könnte, hätte man ne verdammte zeitmaschine ? zumindest rückwärts ?

Schreiben Sie einen Kommentar

Bitte melden Sie sich an, um einen Kommentar zu schreiben.

Back to top button