Midjourney, einer der beliebtesten und von den Ergebnissen her eindrucksvollsten Dienste für KI-generierte Bilder, ist ab sofort in der Version 5 nutzbar.
Lange Prompts
Midjourney 5 besteht auf langen Prompts. Bisher ist das Program in der Version 4 ausgesprochen „kreativ“, wenn der Benutzer besonders kurze Prompts eingibt. Die neue Version setzt nun aber voll auf ausführliche (leider immer noch englische) Prompt-Texte. Zuvor in Version 4 hatte man gute Chancen, mit einem kurzen Text-Prompt wie „beautyfull celebrity“ ein ziemlich schickes Porträt zu generieren. Weitere Angaben hinzuzufügen barg die Gefahr, das Bild zu verschlechtern.
Midjourney 5 setzt dagegen auf möglichst viel Detailinformation. Hier können die Prompts also im Grunde gar nicht ausführlich genug sein. Wichtig ist auch: Bei Version 4 reichte die Aneinanderreihung von Merkmalen, die man nicht einmal durch Kommata trennen musste. Version 5 legt dagegen viel Wert auf vollständige Sätze. Außerdem soll die Wirkung von Worten, die zuvor der Qualitätsverbesserung dienten wie „HDR“, „8k“ oder „Oktane Render“, wirkungslos bleiben.
Midjourney 5: Bessere fotografische Qualität
Der Grund dafür liegt in der verbesserten fotografischen Qualität. Ganz gleich, wieviel Text man eingibt, die Ergebnisse erinnern an Fotos, solange dem Algorithmus nicht eine Korrektur wie etwa ein »in style of a comicbook/ a drawing/ a painting« oder Ähnliches verordnet wird.
In unserem Comic-Beispiel werden zwei Aspekte deutlich: Midjourneys Version 5 liefert mehr Details, aber Kinderkrankheiten wie das von der KI teils unverstandene Konzept des Autofahrens sind noch nicht behoben.
Dafür haben die Entwickler viel Trainingsenergie in die Verbesserung des Fingerproblems und in die Erweiterung der Ausdrucksfähigkeiten von Figuren gesteckt. An einem Beispiel, in dem die dargestellte Figur ihre Hände zeigen und die Zunge herausstrecken soll, wird das ziemlich deutlich.
Die fotografische Anmutung eines Bildes muss nicht nur Vorzüge haben. Vor allem, wenn dabei optische Aspekte wie die Verzerrung ins Spiel kommen. Bei einer Landschaftsdarstellung wie hier ist das Fehlen von Fotorealismus also nicht unbedingt ein Negativkriterium.
Skalierung und Qualitätsoptimierung
Neu ist auch, dass die Upscale-Funktion nicht mehr solche leicht von der Vorschau abweichenden Ergebnisse erzeugt. Jetzt werden schon die vier Standard-Auswahlmotive in voller Auflösung gerechnet.
Außerdem ist es jetzt möglich, auch extreme Quer- oder Hochformate mit dem »–ar« Befehl zu definieren.
Wer die doppelte Menge an Rechenzeit investiert, hat die Option mit dem Befehl »–q 2« die Qualität noch ein klein wenig zu verbessern. Allerdings können sich dabei auch einige Details verändern.
Musterfunktion
Mit der neuen Musterfunktion »–tile« lassen sich auf die schnelle Tour an allen Seiten anschlussfähige Wiederholungsstrukturen für Tapeten, Desktop-Hintergründe oder als Texturgundlagen für Photoshop- oder 3D-Projekte erzeugen. Da die Bild-Kacheln 1024 x 1024 Pixel groß sind, kann man die Muster auch für hochwertigere Anwendungen einsetzen.
Bildgewichtung
Freunde der Kombination von Bildvorlagen mit Multiprompts, also Promptbefehlen, die mit mehreren durch doppelte Doppelpunkte getrennten Segmenten arbeiten, kennen Gewichtungen. Bisher konnte man jedoch nur Textbereiche in ihrer Bedeutung für die Promptausführung gewichten, jedoch keine Bildvorlagen. Das hat sich nun mit dem Befehl »–iw« geändert.
Um davon eine Vorstellung zu bekommen, hier ein kleines Experiment. Ich habe ein Foto von mir vor neutralem Hintergrund als Basis genommen und lasse Midjourney 5 daraus ein Propaganda Porträt machen.
Zugegeben, ich hatte mich etwas männlicher in Erinnerung. Aber das Bild mixt die Textinterpretation im Prompt mit der Bildvorgabe automatisch 1:1.
Mit dem Einsatz der Bildgewichtung und durch Setzen des Wertes auf 2, also »–iw 2« lässt sich der Einfluss des Ausgangsbildes maximieren und ich sehe etwas männlicher aus. Dafür aber nicht mehr sonderlich propagandistisch.
Reduziere ich den Bild-Einflussfaktor auf »0.5«, bleibt fast nur noch die Pose und der neutrale Hintergrund übrig.
Midjourney 5: Fazit
Gut war Midjourney schon länger, aber jetzt wird die Software nicht mehr nur den Illustratoren, sondern auch der Fotobranche gefährlich. Solange es auf grafische Zielsetzungen ankommt, hat Version 4 hier und da noch Vorzüge. Die Domäne der im Alpha-Test laufenden Version 5 sind hochwertige, detailreiche Illustrationen und fotografische Abbildungen.
Was wir hier sehen, ist nur der Start. Die Bildergebnisse können sich im Lauf der Verbesserungen in den nächsten Wochen noch stark verändern. Bisher läuft die Version 5 nicht als Standard-Modus. Ohnehin steht sie aktuell nur den zahlenden Kunden von Midjourney zur Verfügung. Man darf also gespannt bleiben.