
Die neue Generation der Bild-KI, Midjourney v7, lädt zum Testen ein – mit deutlichen Verbesserungen bei Kohärenz, Textur und einer neuen Art der Ideenfindung. Die Gerüchteküche brodelte, nun ist es offiziell: Midjourney hat die Alpha-Phase für seine mit Spannung erwartete Version 7 eingeläutet und lädt die Community zum Testen ein. Was als Flüstern über einen neuen „Draft Mode“ begann, entpuppt sich als umfassendes Upgrade, das weit über beschleunigte Entwürfe hinausgeht. V7 verspricht nicht nur eine sichtbar höhere Bildqualität und bessere Detailtreue, sondern führt auch erstmals eine standardmäßige Modell-Personalisierung ein und verfeinert die Interaktion durch innovative Eingabemethoden – einschließlich der bereits diskutierten Spracheingabe. Für professionelle Bildschaffende könnte dies einen weiteren signifikanten Schritt in der Evolution KI-gestützter Kreativwerkzeuge bedeuten.
Midjourney v7: Ein spürbarer Sprung nach vorn
Die Entwickler sparen nicht mit Superlativen: Midjourney v7 sei ein „erstaunliches Modell“. Konkret soll sich dies in mehreren Bereichen zeigen. Die KI verstehe Text-Prompts deutlich besser, was zu präziseren Umsetzungen führen dürfte. Auch die Interpretation von Bild-Prompts soll „fantastisch“ aussehen. Ein zentraler Punkt ist die Bildqualität selbst: Sie wird als „merklich höher“ beschrieben, mit besonderem Augenmerk auf „wunderschöne Texturen“. Ein notorischer Schwachpunkt vieler Bild-KIs – die kohärente Darstellung von Körpern, Händen und Objekten – soll bei Midjourney v7 signifikant verbessert sein, über alle Detailstufen hinweg. Dies adressiert einen der häufigsten Kritikpunkte und könnte die Nutzbarkeit der generierten Bilder für anspruchsvolle Anwendungen erhöhen. Es ist ein Versprechen auf weniger Nachbearbeitungsaufwand und glaubwürdigere Ergebnisse direkt aus der Maschine.
Die persönliche Note: Modell-Personalisierung als Standard
Ein Novum in Midjourney 7 ist die standardmäßig aktivierte Modell-Personalisierung. Um diese nutzen zu können, müssen Anwender sie einmalig freischalten, was laut Midjourney etwa fünf Minuten in Anspruch nimmt. Genau genommen muss man 200 Bildpaare bewerten, bevor der neue Modus freigeschaltet wird. Danach lässt sich die Funktion jederzeit an- oder abschalten. Die Idee dahinter: Die KI lernt die ästhetischen Vorlieben und den Stil des Nutzers besser kennen und kann so die Prompts individueller interpretieren.
Midjourney verspricht sich davon, die Messlatte dafür höher zu legen, wie gut die KI versteht, „was du willst und was du als schön empfindest“. Dies könnte zu konsistenteren Ergebnissen im bevorzugten Stil führen und die Notwendigkeit reduzieren, Stilreferenzen oder komplexe ästhetische Beschreibungen in jeden Prompt einzubauen. Es bleibt abzuwarten, wie subtil und effektiv diese Personalisierung in der Praxis funktioniert und wie transparent der Lernprozess für den Anwender ist.
Draft Mode: Iteration im Eiltempo und intuitive Interaktion
Das bereits im Vorfeld diskutierte Kern-Feature, der „Draft Mode“, ist ebenfalls Teil von Midjourney V7 und beeindruckt mit konkreten Zahlen: Er soll Bilder zehnmal schneller rendern als bisherige Modi, und das bei halbierten Kosten (bezogen auf die Standard-GPU-Zeit von V6). Diese Geschwindigkeit ermöglicht einen neuen, dialogorientierten Ansatz, zumindest im Web-Interface. Die Prompt-Leiste verwandelt sich in einen „Konversationsmodus“. Man kann Midjourney 7 Anweisungen geben wie „Tausche die Katze gegen eine Eule“ oder „Mach daraus eine Nachtszene“, und Midjourney soll daraufhin automatisch den zugrundeliegenden Prompt anpassen und einen neuen Generierungsprozess starten.
Die bereits erwähnte Spracheingabe wird ebenfalls über den Draft Mode zugänglich: Ein Klick auf den Mikrofon-Button aktiviert den „Voice Mode“. Hier können Nutzer ihre Bildideen laut aussprechen und die Ergebnisse quasi in Echtzeit entstehen sehen – „wie flüssige Träume“, so die blumige Beschreibung der Entwickler. Allerdings sollte man auch hier mit der KI Englisch sprechen, damit sie alle Details versteht. Explizit lässt sich der Draft Mode auch über den Parameter --draft
nach einem Prompt aktivieren, was beispielsweise für Permutationen ({...}
) oder wiederholte Ausführungen (--repeat
) interessant sein kann.
Midjourney positioniert den Draft Mode klar als Werkzeug für die Ideenfindung und schnelle Iteration. Ist ein vielversprechender Entwurf dabei, kann dieser über „Enhance“ oder „Vary“ in voller Qualität neu berechnet werden. Wichtig ist dabei der Hinweis: Draft-Bilder haben eine geringere Qualität als im Standardmodus erzeugte. Das Verhalten und die Ästhetik sollen jedoch sehr konsistent sein, sodass die Entwürfe eine verlässliche Vorschau auf das potenzielle Endergebnis bieten.
Aktueller Stand, Einschränkungen und Ausblick
Da es sich um eine Alpha-Version handelt, gibt es erwartungsgemäß noch Einschränkungen. Funktionen wie Upscaling, Editing und Retexture greifen aktuell noch auf die V6-Modelle zurück; Updates sind hier aber geplant. Moodboards und Stilreferenzen (--sref
) funktionieren bereits mit V7, die Performance soll sich aber mit kommenden Updates noch verbessern. Auch funktioniert die Gewichtung von Prompt-Teilen (noch?) nicht.
Die Roadmap ist ambitioniert: In den nächsten 60 Tagen sollen alle ein bis zwei Wochen neue Features folgen. Als größtes kommendes Feature wird eine neue V7-spezifische Referenzfunktion für Charaktere und Objekte genannt – ein potenziell mächtiges Werkzeug für konsistente Darstellungen über mehrere Bilder hinweg. Midjourney betont zudem, dass V7 ein komplett neues Modell mit eigenen Stärken und Schwächen ist. Nutzer werden ermutigt, zu experimentieren und Feedback zu geben, da möglicherweise angepasste Prompting-Strategien erforderlich sind, um das Beste aus der neuen Version herauszuholen. Eine Community-weite Abstimmung über die Roadmap-Prioritäten ist ebenfalls geplant.
Der Start der V7 Alpha markiert einen aufregenden Punkt für alle, die sich intensiv mit KI-Bildgenerierung beschäftigen. Die Kombination aus Qualitätssteigerung, Personalisierung und dem extrem schnellen Draft Mode verspricht, den kreativen Prozess weiter zu beschleunigen und zu verfeinern. Es ist Zeit zu spielen und die neuen Möglichkeiten auszuloten.