Was ist die Zukunft der Foto- und Bildbearbeitungstechnik? Teil II: Bildbearbeitung
Ein Tweet von „Blender Guru“ über die Zukunft von 3D (Link) brachte mich zum Nachdenken, wie denn die technische Zukunft von Fotografie und Bildbearbeitung aussehen könnte. In Teil 2 geht es um die möglichen Aussichten in Bezug auf Bildbearbeitung. Falls Sie den ersten Teil verpasst haben, finden Sie diesen hier.
Die Gegenwart und Zukunft der Bildbearbeitung
Alles, was ich hier beschreibe, ist teilweise schon Realität. Viele der sich andeutenden Trends werden sich wahrscheinlich noch verstärken und beschleunigen. Bitte bedenken Sie: Das Folgende soll keine detaillierte Analyse sein. Ich halte nur einige meiner aktuellen Gedanken zum Thema fest. Dabei erhebe ich keinerlei prophetischen Anspruch 😉 und keinen auf Vollständigkeit. Aber schauen wir doch einmal.
Abonnements und Open Source
Abo, oje …
Die schlechte Nachricht gleich vornweg: Es wird in absehbarer Zeit wohl kaum noch Kaufsoftware (also eine Dauerlizenz) geben. Softwareentwicklung kostet Geld und Einmalverkäufe sowie periodische Updates reichen da wohl immer weniger, um die Kosten zu decken (siehe Pixelmator-Blog, englisch).
Adobe hat es vorgemacht und liefert mit dem Foto Abo derzeit den Preis-Leistungs-Sieger mit großem Funktionsumfang ab. Skylum baut Luminar als neues Vertriebsmodell auf, bei dem das Abo die günstigste Wahl für ständig neu erscheinende Plug-ins ist (die ständige Neu- und Umentwicklung durch Skylum ist undurchsichtig und wenig vertrauenerweckend; ich teile da die Bedenken und Kritik von Thom Hogan in seinem englischen Blogbeitrag). Auch Pixelmator, von vielen Mac-Anwendern als moderne Photoshop-Alternative genutzt, wechselt zum Abo-Modell (mehr Informationen im Hersteller-Blog, englisch). Ich denke, auch bei Affinity Photo ist es nur eine Frage der Zeit, bis auch Serif nicht mehr um den Abo-Vertrieb herumkommt, obwohl gerade das immer deren Verkaufsargument war und noch ist. Auch dort wird über einen Wechsel zumindest nachgedacht, wie eine kürzliche Kundenumfrage nahelegt (es wurde die Frage gestellt, ob man lieber einmalig oder lieber häufiger kleine, regelmäßige Beträge für eine Software zahlt).
Das Problem ist, dass sich alle Angebote mit dem Adobe Foto-Abo messen lassen müssen, auf dessen Preisniveau (etwa 10 Euro/Monat) sich die meisten Mitbewerber offenbar einpendeln. Und da wird es natürlich schwierig mitzuhalten, wenn man den Funktionsumfang und die damit möglichen Workflows des Foto-Abos vergleicht (siehe meinen umfangreichen Premiumworkshop über die modernen CC-Workflows).
Open Source?
Die auf lange Sicht wohl einzige Alternative zu diesem Wettrennen ist vielleicht Open-Source-Software. Bei der 3D-Software Blender funktioniert das ja ganz hervorragend. Dank vieler Sponsoren ist die Entwicklungsgeschwindigkeit rasant und die Möglichkeiten unbegrenzt. Blender ist damit bereits konkurrenzfähig zu den alten Platzhirschen – bekommt aber in den großen 3D-Schmieden nur zögerlich einen Fuß in die Tür. Der Grund sind eingespielte Teams und individualisierte Arbeitsabläufe, die eben auf den bereits länger genutzten Programmen basieren. Ähnlich ist das bei der Bildbearbeitung. Photoshop mit seiner Plug-in-Schnittstelle, den Skripten, Erweiterungen, Aktionen … ist nicht so einfach in der Team-Produktion zu ersetzen. Der Bildbearbeitungseditor GIMP etwa hinkt auch bei den notwendigen Funktionen für professionelle Produktionen (das fängt schon bei Einstellungsebenen an) noch Jahre, wenn nicht Jahrzehnte, hinterher. Das ist dann eher etwas für private Gelegenheitsanwender.
Aber auch bei Blender bildet sich bereits rund um den Open-Source-Kern ein riesiger Markt an Erweiterungen, Diensten und Assets. Einige sind gratis, andere kauft man für mehr oder weniger Geld und andere, nun ja, sind eben im Abo verfügbar (beispielsweise Blenderkit) … das ist der Lauf der Dinge.
GPU- und Cloud-Berechnung
Raw-Konverter wie Capture One und auch Camera Raw und Lightroom liefern out-of-the-box bereits hervorragende Ergebnisse. Dank GPU-Beschleunigung muss man in den Raw-Konvertern und Bildbearbeitungsprogrammen wie Photoshop und Affinity Photo kaum noch auf die Ergebnisse von Korrekturen und Filtern warten (Luminar Neo mal außen vor; das lahmt bei fast allen Aktionen selbst auf meinem Mac Studio).
Einige Dinge lassen sich nicht auf heimischen Computern oder Mobilgeräten berechnen. Da müssen größere Geschütze aufgefahren werden, um das zu übernehmen. Der Weg der Zukunft ist das Berechnen über die Cloud, wie es schon beim Xbox Cloud Gaming oder bei Photoshops Neuralfiltern der Fall ist. Aufwendige Grafikberechnungen und KI-gestützte Algorithmen sind durch die Auslagerung in die Cloud auch auf schwachbrüstigen Rechnern und Mobil-Geräten möglich. Und damit sind wir schon beim wahrscheinlich wichtigsten Thema der Zukunft mit dem marktschreierischsten Schlagwort: KI – der Künstlichen Intelligenz.
Künstliche Intelligenz
Eine wirkliche Intelligenz ist bei allen Nennungen von KI oder dem englischen Pendant AI (artificial intelligence) nie im Spiel. Immer geht es um Algorithmen (Was ist das überhaupt?), die durch maschinelles Lernen „programmiert“ worden sind. Mehr über neuronale Netze und Deep Learning erfahren Sie in diesem Blogbeitrag von Kollege Michael J. Hußmann.
Aber auch wenn hier kein Bewusstsein im Spiel ist, sind die Möglichkeiten und Anwendungsgebiete vielseitig und beeindruckend. Das, was jetzt schon möglich ist, wird in den kommenden Jahren weiter verbessert. Eine kleine Auswahl an Möglichkeiten und Beispielen:
Automatische Inhaltserkennung und Verschlagwortung per KI
Eine große Hilfe bei der Bildverwaltung und beim Wiederfinden von Bildern ist bereits jetzt die automatische Inhaltserkennung bei Bildern in der Apple Cloud oder bei Adobe Lightroom (Mobile/Cloud). Für Lightroom Classic leistet das Plug-in Excire Search gute Dienste, als Standalone Excire Foto. Aber es könnten noch viel mehr Details erkannt, Objekte, Tiere und Personen genauer identifiziert werden. Ich denke nicht, dass es hier demnächst einen großen neuen Durchbruch geben wird, sondern eine kontinuierliche aber überschaubare Verbesserung.
Rauschreduzierung und Schärfung per KI
Bei der Schärfung und Verwacklungsreduzierung von Bildern ist Topaz Sharpen AI zur Zeit ganz vorn dabei.
Beim Entrauschen von Raw-Dateien ist der Platzhirsch meiner Meinung nach zurzeit DxO PureRaw. Mehr darüber finden Sie in meinem Blogbeitrag zur Version 2.
Skalierung und Detailrekonstruktion per KI
Gigapixel vergrößert Bilder ohne Detailverlust und Remini rekonstruiert verwachsene Details. Was wie eine Schärfung wirkt, ist aber keine. Denn statt nur die Helligkeit vorhandener Pixel zu verändern, werden die Details eines Bildes erkannt und durch möglichst ähnliche, aber höher auflösende ersetzt. Die Ergebnisse können frappierend sein. Und das wird in Zukunft sicher noch zuverlässiger und beeindruckender funktionieren.
Einen Vergleich verschiedener Rekonstruktionsprogramme finden Sie im kommenden Heft DOCMA 103.
Retusche und automatische Bildverbesserung per KI
Auch den Retusche-Alltag wird KI nachhaltig verändern. Die automatische Bildverbesserung in Camera Raw und Lightroom basiert auf KI und schafft eine gute Ausgangsbasis für die weitere Optimierung.
Luminar Neo setzt auch auf KI. Sensorflecken oder störende Stromleitungen erkennt und entfernt die Software per Mausklick.
Selbst die professionelle Hautretusche wird eines Tages niemand mehr per langwierigem Dodge-and-Burn durchführen. Ein gutes Auge braucht es dann immer noch, um etwa die automatischen Ergebnisse selektiv nach den Vorgaben der Auftraggeber abzustimmen. Aber was jetzt schon möglich ist, zeigen die Plug-ins von Retouch4me. Der hohe Preis jedes einzelnen Plug-ins amortisiert sich im professionellen Alltag schnell. Das Plug-in „Dodge-and-Burn“ erzeugt etwa eine Grauebene, wie sie auch ein Könner erzeugen würde – jedoch in einem Bruchteil der Zeit. Der Vorteil: Man kann dieser Ebene mit den altbewährten Techniken leicht den letzten Schliff geben.
Bildsegmentierung per KI
Ein großes Thema ist auch die Bildsegmentierung. Ist diese einmal perfektioniert, gehört das nervige Freistellen der Vergangenheit an. Zwar ist jetzt schon dank »Objektauswahl-Werkzeug« und »Haare verfeinern« in Photoshop bereits einiges einfacher und schneller geworden. Die Qualität reicht meist aber nur für schnelle Optimierung für die Internetausgabe oder eben simple Memes. Oft muss man doch noch so viel korrigieren, dass man genauso schnell ist, wenn man gleich mit Zeichenstift und Kontrastmaskierung freigestellt hätte. Aber das wird sich definitiv ändern. Die KI-Modelle und deren Resultate werden immer besser. Objekt-ID-Masken, wie sie heute 3D-Programme erzeugen, werden durch KI auch aus Fotos automatisch abgeleitet werden.
Ganz neue Möglichkeiten bieten auch automatisch generierte Tiefenkarten. Mit dem Neuralfilter »Tiefenunschärfe« können Sie diese schon heute erzeugen. Nur die Qualität lässt oft noch zu wünschen übrig. Wenn diese einmal besser sind, können Sie Szenen neu beleuchten (siehe Premiumworkshop in Heft 103!), Farbe für Vorder- und Hintergrund getrennt einstellen und nachträglich die Schärfentiefe festlegen. Mobile Apps wie Focos zeigen, wie effektiv ein Userinterface für solche kreativen Optimierungen sein kann. Ein paar Screenshots aus meinem Video zum Premiumworkshop aus Heft 103:
Effekte und Bildstile per KI
Effekte, Looks und Bildstile sind eine kreative Spielwiese für Anwendungen mit künstlicher Intelligenz. Um nur ein Beispiel von vielen zu nennen: Sie könnten ein Foto in ein Gemälde im Stile van Goghs verwandeln.
Hier schlummert viel kreatives Potenzial. Wie wichtig es ist, die KI-Modelle mit den richtigen Ausgangsbildern für das maschinelle Lernen zu versorgen, sieht man an diesem Beispiel wunderschön. Nightcafe.Studio hat hier einen deutlichen Vorsprung.
Mimik, Pose, Beleuchtung per KI ändern
Was im Neuralfilter »Smart Portrait« zurzeit noch eher schlecht als recht funktioniert, wird sich in Zukunft deutlich verbessern. Das Anpassen des Gesichtsausdrucks, das Ändern der Kopfdrehung oder der Blickrichtung und das Ändern der Beleuchtungsrichtung wird fotorealistisch und schnell sein. Aktuell ist es noch ein Glücksspiel und man muss aufgrund der derzeit langsamen Cloudverarbeitung auch noch unverhältnismäßig lange auf die Ergebnisse warten.
Es gibt bereits KI-gestützte Verfahren, 3D-Modelle aus Fotos zu generieren, sodass diese frei drehbar sind (Beispiel von Nvidia). Zukünftig werden wir nicht mehr so leicht schmunzeln, wenn in einem Science-Fiction-Film mal die Rückseite einer Person oder eines Objektes aus einem verpixelten Foto plötzlich hochauflösend extrahiert wird. Klar muss Ihnen jedoch sein, dass diese Rückseite von der KI nur anhand vorherigem Trainings erfunden wurde. Das Ergebnis kann mit der Realität übereinstimmen, muss es aber nicht und wird es meist auch nicht.
Komplette Bildkreation per KI
Eine weitere, gerade top-angesagte Anwendung von künstlicher Intelligenz ist das Erzeugen von Bildern anhand von Text- oder Skizzen-Eingaben.
Kreation per Texteingabe
Was mit Dall-E Open AI und Midjourney möglich ist, grenzt schon an Magie. Personengeneratoren (Beispiel-Report, dass künstliche Personen sogar vertrauenswürdiger erscheinen als echte) erschaffen fotorealistische Porträts von Personen, die es nicht gibt.
Bei Midjourney habe ich meine kostenlosen Credits bereits für einige Experimente verbraucht. Aber die Ergebnisse können sich bereits sehen lassen. Auch hier benötigt man übrigens ein Abo, das aber durch die benötigte Rechenleistung notwendig und absolut gerechtfertigt ist.
Kreation per Skizze
Dank PC und Nvidia-Studio (mehr Informationen, mein RTX-Laptop dafür ist von notebooksbilliger.de) kann ich auch mit Nvidia Canvas spielen. Hier wird der Ansatz verfolgt, der KI per Skizze mitzuteilen, was man erzeugen möchte. Es gibt also Himmel-, Wolken-, Berge-, Wasser- und so weiter – Werkzeuge also, mit denen man das Bild grobschlächtig anlegt. Die KI ergänzt dann die Details und macht das Ergebnis fotorealistisch. Für eine Beta-Version sind die Ergebnisse schon recht ansehnlich. Also teilweise. 😉 Hier einige unterschiedlich komplexe Beispiele.
Moderne UIs … Mobile … Zusammenarbeit …
Neben all dem KI-Gedöns, das freilich extrem faszinierend ist, würde ich mir auch eine erhebliche Verbesserung der traditionellen Werkzeuge wünschen. Das Userinterface der Photoshop-Korrekturen und -Filter (also auch die durch Affinity Photo kopierten) ist ziemlich in die Tage gekommen. Und damit meine ich nicht, wie hübsch diese aussehen, sondern welche Möglichkeiten sie bieten und wie ergonomisch und effektiv sie zu benutzen sind. Wie es besser (manchmal auch nur anders) geht, sieht man in Video- und 3D-Programmen. Dort gibt es Kurven für das Abstimmen von Sättigung und Farbton, Nodes für kreative und komplexe Verkettungen von Korrekturen, Kurven, die sich deutlich einfacher und flexibler ändern lassen als das olle Konzept der ausschließlich kanalweisen Steuerung (zielgenaue Farbeinstellungen per Mittelmaustastenklick und dergleichen; fast schon Sci-Fi für traditionelle 2D-Software). Pie-Menüs für den schnellen Zugriff auf Funktionen. Oder auch Farbkorrektur-Werkzeuge wie Gitternetze und dergleichen, wie Sie in DaVinci Resolve oder dem 3DLut Creator zu finden sind.
Ob es hier größere Innovationen geben wird, ist gegenüber den verkaufsfördernden eindrucksvollen KI-Zauberkästen wohl zweifelhaft. KI sieht eindrucksvoll in Demos aus und reicht für Webanwendungen jetzt oft schon aus. Damit holen die Softwarefirmen natürlich schon eine große Anwenderzahl ab. Professionelle Anwender können da nur Daumen drücken und hoffen, dass Adobe und Co. sie nicht vergessen haben.
In diesem Sinne.
Hi,
die Verwendung des Begriffs Abo klingt so harmlos.
Wenn man z.B. bei Zeitschriften das Abo kündigt, kann man die bisherigen Ausgaben
weiterhin öffnen (aufschlagen) und die Inhalte sind nicht verschwunden sondern weiterhin lesbar.
Bei Software-Abos kann man wohl davon ausgehen, das nach der Kündigung diese dann nicht mehr zu öffnen und nutzen sind.
Miete statt Abo wäre wohl der anschaulichere Begriff und sollte ‚flächendeckend‘ genutzt werden !
Ich hoffe, dass nur wenige auf die Miet-Modelle aufspringen und folglich werden dann weiterhin Vollversionen zu kaufen sein.
Bye,
Rainer
Hallo Rainer, da hast du Recht. Miete trifft es besser. Werd ich mal im Hinterkopf behalten.