2022. Zeitenwende.
Wir leben in einer Zeitenwende. Kanzler Scholz bezog sich in seiner Rede vom 27. Februar 2022 auf die Veränderung des politischen Klimas durch Putins Angriff auf die Ukraine. Wir befinden uns aber womöglich mitten in einer viel größeren Umwälzung mit einer Vielzahl von Technologien, deren potenzielle Tragweite vielleicht nicht jedem bewusst ist. „Kunst“ per KI ist dabei nur ein ganz kleines Rädchen. Mein letzter Blogbeitrag für dieses Jahr und eine ausführlichere Bestandsaufnahme.
„Zeitenwende“ – Wort des Jahres
„Zeitenwende“ ist das Wort des Jahres 2022, gewählt von der Gesellschaft für deutsche Sprache (GfdS). Das Wort an sich ist nicht neu – es steht für einen beliebigen Übergang in eine neue Ära. Bundeskanzler Olaf Scholz sprach (Quelle) von einer Zeitenwende in Bezug auf das geänderte politisch-wirtschaftliche Klima in Europa und der Welt aufgrund des Angriffs Russlands auf die Ukraine am 24. Februar 2022. Es ist auch eine emotionale Wende, es gäbe wieder Angst vor einem Weltkrieg – gar einem Atomkrieg. Matthias Heine nennt „Zeitenwende“ in der Welt ein starkes Wort, an dem komme keiner vorbei. Und das trifft auch meiner Meinung nach zu. Aber nicht nur in Bezug auf die Weltpolitik.
Was passiert(e) denn gerade?
Wenn wir einmal von der vergänglichen Weltpolitik, der destruktiven Natur des Menschen, seinen schxxß Kriegen und den unsäglichen Verirrungen vieler Religionen und Ideologien absehen, dann entwickeln sich gerade viele Dinge, die große Veränderungen in der Geschichte der Menschheit darstellen könnten. Konjunktiv, denn sicher kann das ja niemand wissen! Vergleichbar ist in etwa die Kontrolle des Feuers, die Entwicklung der Schrift. Nur in einem viel größeren, disruptiven Ausmaß. Das betrifft alle Generationen nach uns. Und wir sind mittendrin. Das Internet ist bereits allgegenwärtig geworden. Eine kleine (recht willkürlich-spontane) Auswahl dessen, was ist und noch kommen mag. Keine Sorge, es geht auch um uns Fotografen und Bildbearbeiter. 😉
Kernfusion
So hat etwa erstmals ein experimenteller Kernfusionsreaktor gezündet und dabei mehr Energie erzeugt, als zur Zündung aufgewendet wurde. Zur effektiven Energieproduktion reicht das noch lange nicht und bis zur dauerhaften Energieerzeugung müssen noch viele andere Probleme gelöst werden. Aber das ist ein Meilenstein. Denn die Fusion ist unter kontrollierten Bedingungen wiederholbar. Es wäre eine fast unerschöpfliche und zudem recht sichere und saubere Energiequelle. Mehr Informationen. Diese Technologie könnte sogar dabei helfen, den gerade stattfindenden Klimawandel abzubremsen.
Kosmologie und Raumfahrt
Dank des James-Webb-Weltraumteleskops blicken wir tiefer, schärfer und zeitlich weiter zurück ins All als je zuvor. Die Menschheit sollte sich mehr als je zuvor seiner Winzigkeit und Hybris bewusst werden. Und jeder einzelne Mensch sollte sich nicht für so wichtig nehmen, für wie er sich hält. Dass wir in diesem unfassbaren Universum leben, ist ein Wunder. Und wir schlagen einander immer noch die Köpfe ein. ?♂️
Der erste Flug rund um den Mond seit dem letzten bemannten Flug vor 50 Jahren ist erfolgreich inklusive Landung auf der Erde durchgeführt worden. Mehr Informationen Das macht den Weg frei für erneute bemannte Flüge – inklusive Landung auf dem Mond. Was wiederum den Weg ebnet für weitere bemannte Missionen zu anderen Planeten (Mars) und später Monden (etwa um Jupiter). Vorausgesetzt, wirtschaftliche Zwänge, Kriege, Religionen oder Ideologien machen das nicht zunichte. Leider schafft es die Menschheit bisher nicht, sich über diesen ganzen Unfug zu erheben.
Künstliche Fortpflanzung
Das könnte jetzt vielen Angst machen: Ectolife ermöglicht theoretisch außerkörperliche Schwangerschaften – inklusive Fortschrittskontrolle per App und optionalem Gen-Splicing für optimalen Nachwuchs. Höchst interessant und gruselig zugleich. Viel Potenzial, viele Gefahren. Und ein ethisches Minenfeld. Genau das Thema meiner dystopischen Artworks. 😉 (Guter Vorsatz für das nächste Jahr: Ich muss mir mal wieder mehr Zeit dafür nehmen.)
Internet und künstliche Intelligenz
Die Bildgenerierung aus Texten ist das Schwerpunktthema der aktuellen DOCMA (Heft 104). Darauf möchte ich deshalb an dieser Stelle gar nicht tiefer eingehen. Nur soviel: Die Technik hat sich in diesem Jahr so rasant entwickelt und verbessert, dass man kaum noch Schritt halten kann, wenn man sich nicht ausschließlich für dieses Thema interessiert. Klar ist, dass diese Art der KI Künstler verärgert und sie um ihre Jobs bangen lässt. Denn alle Jobs, die unter einem bestimmten Anspruchsniveau liegen, werden unweigerlich entfallen. Wozu soll der Autor eines Romans noch einen Illustrator für das Titelblatt beauftragen? Er kann sich mit einer KI-Software einen Tag lang hinsetzen und durch Versuch und Irrtum tausende Bildvarianten per Texteingabe so lange erzeugen und variieren, bis er zufrieden ist. Das kostet aktuell keine 30 Euro im Monat (Midjourney-KI) oder bei lokaler Ausführung – außer der Nvidia- oder Mac-Hardware – nichts und erspart lange Einweisungen, Änderungswünsche und Diskussionen.
Bei alledem bleibt nur die Frage nach dem Copyright und dem Urheberrecht offen. Denn das ist alles Neuland, bei dem sich selbst Gerichte noch nicht einig sind (aktuelles Beispiel).
Aber sind solch große Veränderungen neu?
Von überall Texte, Bilder und Sprachnachrichten herumschicken zu können, war vor 30 Jahren noch eine Utopie für die meisten. Und was haben wir früher über hypothetische Deppen-Automatiken wie eine „Motivklingel“ beim Fotoapparat (nicht nur Gesicht-, Augen- und Motivautofokus sind schon Realität, sondern noch viel mehr) gespöttelt. Einen „Mach Kunst!“- oder „Mach das schön“-Knopf in Photoshop – ja, das war lustig. Dank KI aber schon Wirklichkeit (inhaltsbasiertes Entfernen, Neuralfilter, Beauty-Retouching-KI-Extensions, Luminar- und Topaz-AI und so viele mehr) – wenn auch noch nicht für jedermanns Geschmack anpassbar. Motivauswahl per Spracheingabe? Freistellen per Fingerdruck auf dem iPhone? Verwackelte Bilder schärfen? Bilder in CSI-Manier beeindruckend scharf hochskalieren? Aufwendige Retuschen per Inpainting und ein paar Pinselstrichen durchführen? Objekte in Bilder einfügen und automatisch mit Licht und Schatten beleuchten lassen? Aus Schallwellen an den Fensterscheiben den Aufbau von Zimmern und die Position der Personen darin feststellen – ja, auch um die Ecke „schauen“? Ein optischer Tarnumhang? – Alles – und noch viel mehr – schon Realität, die oft nur noch etwas Optimierung bedarf. Vergeben Sie mir, wenn ich jetzt nicht für jeden einzelnen Punkt eine Quelle verlinke. Aber alle Informationen dazu finden Sie schnell per Google heraus. Ich weiß noch, wie mir vor gefühlten „drei Millionen“ Jahren jemand in einer Newsgroup die neue, noch unbekannte, geniale Suchmaschine Google empfahl und ich von deren Ergebnissen extrem beeindruckt war. Heute ist sie Alltag. In Zukunft könnte Sie vielleicht niemand mehr kennen, weil ChatGPT übernimmt (Alarmstufe Rot bei Google).
ChatGPT
ChatGPT (einen guten Überblick finden Sie hier bei Heise.de) könnte das Ende von Google als Suchmaschine bedeuten. Denn mit dieser KI kann man sich wie mit einem Menschen unterhalten. Mit ChatGTP sind Rollenspiele und stundenlange Unterhaltungen möglich.
Mit ChatGPT im Ohr würde jeder bei „Wer wird Millionär?“ gewinnen.
Denn ChatGPT kennt per Machine Learning beinahe das gesamte Internetwissen und kann es verständlich vermitteln, Fragen und Zusammenhänge herstellen und in menschlicher Manier antworten. Ich würde sowohl medizinisch als auch rechtlich nicht meinen Hintern auf die Ergebnisse verwetten, aber sie sind in jedem Fall ein guter Startpunkt für die eigene, darauf aufbauende Recherche.
Ein Beispiel gefällig?
Ich habe ChatGPT gebeten, ein Wort zu erfinden, das es noch nicht gibt und es in wenigen Sätzen zu erläutern:
Per DeepL-KI (ja, auch eine immer besser werdende KI, die Sie übrigens neben der Translate-Funktion von Google benutzen können, um fremdsprachige Webseiten zu übersetzen, die ich hier mitunter verlinke) übersetzt:
Prompt: Bilde ein neues Wort für etwas, für das es noch kein Wort gibt. Erkläre das neue Wort in ein paar Sätzen.
Antwort: Das neue Wort, das ich kreieren werde, ist „solitudeity“ (Einsamkeit), das sich auf das Gefühl bezieht, allein und zufrieden in seiner eigenen Gesellschaft zu sein. Dieses Wort könnte verwendet werden, um das Gefühl zu beschreiben, die Einsamkeit zu genießen, oder den Zustand, sich mit dem Alleinsein wohlzufühlen. Jemand mit einem hohen Grad an Einsamkeit verbringt beispielsweise lieber Zeit allein als in Gesellschaft anderer und empfindet Einsamkeit als Quelle der Ruhe und Entspannung. Jemand mit geringem Einsamkeitsgefühl hingegen fühlt sich vielleicht ängstlich oder unwohl, wenn er allein ist, und sucht vielleicht die Gesellschaft anderer, um sich wohler zu fühlen.
Ist das nicht beeindruckend (also der Text, weniger das Bild)?
Als Introvertierter können Sie das neue Wort vielleicht genauso gut verstehen und benötigen wie ich. Die beschriebenen Eigenschaften schwingen zwar schon bei „Solitude“ oder „Abgeschiedenheit“ mit, aber vielleicht nicht so eindeutig. Aber vielleicht verstehen Sie jetzt, wie ein Google-Angestellter zu der Auffassung kam, dass die von ihm betreute KI ein Bewusstsein erlangt hat (mehr Informationen).
Text2image-prompts per ChatGPT
Und wissen Sie was? Man kann den Chat-Bot darum bitten, eine gute Eingabe („Prompt“) für Text-zu-Bild-Generatoren wie Stable Diffusion, Midjourney, Dall-E zu generieren (Beispiel).
Sie müssen also nicht einmal mehr herausfinden, wie man die korrekten Eingaben bei Bild-KI-Generatoren am besten vornimmt. Sie benötigen nur noch eine Idee, fragen ChatGPT wie man die am besten umsetzt und voilà! Wie weit diese neuen Möglichkeiten gehen und wie viel besser (ich sage: massiv besser!) die Resultate werden, sehen wir in den nächsten Jahren. Schon im Jahr 2023.
Klar ist für mich: Die klassische Stockfotografie ist irgendwann tot. Wozu lange Stockfoto-Datenbanken durchsuchen, wenn man exakt das gewünschte Ergebnis in Sekunden per KI erzeugen kann? Adobe lässt bereits per KI generierte Bilder bei Adobe Stock zu (mehr Informationen). Fraglich und absolutes Neuland ist bei allem KI-Kram nur noch eins: das Urheberrecht (oder im englischsprachigen Raum das Copyright). Denn alle KI-Bilder sind durch Machine-Learning entstanden – also aus Fotos oder von Künstlern geschaffenen Bildern „inspiriert“ (meist noch ungefragt und unbezahlt!).
Noch ein ChatGPT-Beispiel gefällig?
Eigentlich wollte ich einen Blogpost über die Vorteile generativer Text-Bild-KIs schreiben. Dachte mir aber, ich frage mal ChatGTP. Mir scheint, ich bin als Blogschreiber auch überflüssig geworden …
Mein Prompt:
„Write a blog post about the benefits of text to image generative ai.“ (Sie können kein Englisch? Erinnern Sie sich an meine obige Empfehlung von DeepL?)
Antwort:
„Die generative Text-Bild-KI, auch bekannt als textbasierte Bilderzeugung, ist eine Art von KI, die auf der Grundlage von Texteingaben realistische Bilder erzeugen kann. Diese Technologie hat das Potenzial, verschiedene Branchen zu revolutionieren, darunter Kunst, Werbung und Design.
Einer der Hauptvorteile der textbasierten generativen KI ist die Möglichkeit, personalisierte Bilder zu erstellen. So kann ein Benutzer beispielsweise eine Beschreibung einer bestimmten Szene oder eines Objekts eingeben, und die KI generiert ein entsprechendes Bild. Auf diese Weise können sehr individuelle und einzigartige Bilder erstellt werden, die für verschiedene Anwendungen nützlich sein können.
Ein weiterer Vorteil der generativen Text-Bild-KI besteht darin, dass sie Zeit und Ressourcen spart. Anstatt Stunden damit zu verbringen, ein Bild von Grund auf zu erstellen, können Benutzer einfach eine Beschreibung eingeben und den Rest der KI überlassen. Dies kann besonders für Unternehmen und Organisationen nützlich sein, die schnell und effizient eine große Anzahl von Bildern erstellen müssen.
Neben den praktischen Anwendungen hat die generative Text-Bild-KI auch das Potenzial, unsere künstlerischen Fähigkeiten zu verbessern. Mit dieser Technologie können Künstler mit verschiedenen visuellen Ideen experimentieren und schnell entsprechende Bilder erzeugen. Dies kann die Schaffung neuer und aufregender visueller Kunst ermöglichen, aber auch die Fähigkeit, bestehende Ideen zu verfeinern und zu verbessern.
Insgesamt sind die Vorteile der generativen KI von Text zu Bild zahlreich und vielfältig. Vom Potenzial für die personalisierte Bilderstellung bis hin zur Zeit- und Ressourcen-Ersparnis hat diese Technologie das Potenzial, verschiedene Branchen zu revolutionieren und unsere künstlerischen Fähigkeiten zu verbessern.“
Die disruptiven Auswirkungen aller KI-Entwicklungen
Alles, was heute Sachbearbeiter, Datenanalysten und Anwälte (und viele andere Berufe) erledigen, könnte in Zukunft auch durch eine KI durchgeführt werden. Fundierte Blogbeiträge schreiben, Belege für einen Steuerbescheid zusammensuchen und daraus eine optimale Steuererklärung erzeugen, Einspruchsschreiben gegen Amtsbescheide erstellen, ganze Stadtverwaltungen anhand der Daten aus tausenden verschiedenen Datenquellen automatisiert optimieren. Dinge, für die ein Beamter heute noch eine Woche benötigt, könnte in eine KI bald per Mausklick in Echtzeit erledigen.
Simple Alltags-Illustrationen benötigen, wie oben erwähnt, keine Illustratoren mehr. Aktien-Wahrsager können gegen eine mit einem Webcrawler kombinierte KI einpacken. Anderes Beispiel: Schon jetzt erkennt eine KI anhand von Röntgen- und Zell-Scans zuverlässiger und schneller Krebs als die besten Ärzte. Was glauben Sie, in welchen „Händen“ in Zukunft das Experten-Wissen und die direkte Anwendung und Analyse von Daten liegt?
Das alles ist eine disruptive Technologie, die unser gesamtes Arbeits- und Gesellschaftssystem nachhaltig verändern könnte. Nicht nur Künstler müssen um ihre Jobs bangen. Die Auswirkungen sind wahrscheinlich viel umfassender, als wir es uns gerade vorstellen können.
Wie sich das Ganze auf das Leben der Menschen auswirkt, hängt aber wie immer von den Menschen selbst und ihrer Gesellschaft ab. Eine Ablehnung neuer Technologien bringt uns nicht weiter. Aber es braucht wohl in absehbarer Zeit neue Systeme für Wirtschaft, Wertschöpfung und Lebensunterhalt. Ich bin kein Zukunftswissenschaftler (die ohnehin wie die Religionspropheten zuverlässig daneben lagen und liegen). Ich sehe nur, wie die Verkäufe von Heften am Kiosk immer weiter sinken. In den meisten Zeitschriftenverkaufsregalen findet sich nur noch Klatsch und Tratsch neben den Produktionen großer Verlagshäuser. Ich sehe, wie sich (Stock-) Fotografen und manche Künstler bereits umorientieren, um ihren Lebensunterhalt zu bestreiten. Und ich sehe, was die noch dumme KI jetzt schon kann. Da brauche ich nur eins und eins für die nächsten Jahre zusammenzuzählen.
Frohes Fest!
Wie auch immer … wir leben in spannenden Zeiten! Panta rhei, bleiben Sie im Fluss und wir lesen, sehen und hören uns im neuen Jahr wieder. Bleiben Sie neugierig. Denn dabei kann ich Ihnen als (Neu)GIERmann weiter behilflich sein. Ich wünsche Ihnen fröhliche Feiertage und einen guten Rutsch ins neue Jahr. Das sollte logischerweise eigentlich zur Wintersonnenwende stattfinden, wenn Sie mich fragen! Aber das nur am Rande. 😉
Bis denne dann!
Great read!