Topaz Gigapixel 8 – Bildvergrößerung und -verbesserung jetzt auch mit generativen Funktionen
Macht Topaz Gigapixel in Version 8 den klassenbesten, aber auch teuersten Upscaler Magnific.ai überflüssig? Olaf Giermann hat sich das einmal für Sie angeschaut.
Bildvergrößerer
Fähige Programme zur Bildvergrößerung, üblicherweise Upscaler genannt, sind eine große Hilfe für Bildbearbeiter, die von Kunden oft nur kleine, abfotografierte Bildchen von den Kunden erhalten. Aber auch Fotografen, die einen Schnappschuss oder den Ausschnitt eines Fotos vergrößern möchten, profitieren von KI-basierten Upscalern. Und wer seine Bilder komplett per KI generiert muss diese 512 × 512 bis meist 1024 × 1024 kleinen Bildchen ja noch auf eine benutzbare Größe bringen.
Insbesondere die Firma Magnific.ai zeigt eindrucksvoll, was aktuell per KI möglich ist (mehr dazu in diesem Blogbeitrag):
Hier wird nicht einfach das Bild vergrößert und dann die Kanten geglättet, wie es herkömmliche Bildvergrößerungsalgorithmen tun, sondern es können je nach Einstellung mehr doer weniger Details rekonstruiert oder kreativ hinzuerfunden werden.
Und ja, wird ein Foto(-ausschnitt) derart vergrößert, ist das Ergebnis dann streng genommen keine Fotografie mehr. Aber wen interessiert das, wenn Sie so Ihr Lieblingsfoto aus einer alten 4-Megapixel-Kamera mit glaubwürdigen Details in Übergröße an die Wohnzimmerwand hängen können? 😉
Generative Skalierung in Topaz Gigapixel 8
Das Redefine-Modell (Beta) basiert auf generativer KI, es ist also in der Lage, Details nicht nur hinzuzuerfinden, sondern diese auch per Textbeschreibung abzuändern. Das eröffnet neben den weiterhin verfügbaren „herkömmlichen“ KI-Skalierungsmodellen ganz neue Möglichkeiten.
Die Firma Topaz zeigt auf ihrer Website das Ändern eines Bildes von einer Herbst- zu einer Winterszene mit dem Prompt »Make it winter«:
Ich hatte mit meinen Prompt-Versuchen trotz hoher Werte für „Creativity“ nicht so viel Glück. Der Prompt »Make it a wasp made of sparkling diamonds sitting on tree bark« hat das Bild zwar deutlich verändert und die Anatomie der Fühler und Flügel komplett zerhauen, zeigt aber bis auf den Wespenhinterleib kaum eine Wirkung des Prompts. Hier muss sich noch zeigen, worauf und womit das Redefine-Model trainiert wurde. Vielleicht gibt es solche gewünschten Änderungen ja nicht her. Und wir dürfen nicht vergessen: Es befindet sich noch in der Beta-Phase.
Für kreative Bildänderungen würde ich Topaz Gigapixel aktuell nicht empfehlen. Das Prompt-Eingabefeld ist aktuell mehr ein Gimmick als wirklich nützlich. Aber das kann sich bestimmt noch ändern.
Vergrößerung von KI-Bildern
Beeindruckt hat mich aber das Vergrößern eines Bildes, das ich mit Stable Diffusion generiert hatte. Das Original mit 512 × 512 Pixel:
Die Vergrößerung mit dem Standardmodell um den Faktor 4 ist schon ziemlich gut (hier nur verkleinert gezeigt, aber man sollte den Unterschied erkennen):
Das Redefine (Beta)-Model fügt jedoch realistische Details hinzu, die den Rechenaufwand lohnen:
Das ist schon verdammt nah an dem, was Magnific.ai bietet. Dabei kostet Topaz Gigapixel einmalig den Preis des mittleren Pakets von Magnific.ai: 99 US-Dollar. Da ich solche Hochskalierungen nur für ausgewählte Bilder benötige, lohnt sich ein Magnific-Abo nicht. Topaz Gigapixel dagegen schon.
Der größte Nachteil der generativen Skalierung von Gigapixel 8
Von Vorteil ist, dass Sie für „Redefine“ in Topaz Gigapixel keine Bilder auf ausländische Server hochladen müssen, um sie zu skalieren.
Der Nachteil ist, dass die lokale Berechnung langsam ist. Also wirklich laaaaaaaaaaaaaaaangsam! Sie warten bei der aktuellen Beta-Version immer mehrere Minuten – selbst auf eine kleine Vorschau. Nun nutze ich nicht den langsamsten Computer (Mac Studio M1 Ultra). Ich hatte aber beim Experimentieren schon bei der Minivorschau-Berechnung schnell die Geduld verloren und bin dazu übergegangen, einfach mehrere Bilder (und Duplikate davon) ohne Vorschau, aber mit verschiedenen Parameter-Kombinationen zu exportieren und den Export im Hintergrund laufen zu lassen. Topaz Gigapixel nutzt weder alle CPU-Kerne oder GPUs meines Rechners, noch werden diese auch nur ansatzweise ausgelastet.
Immerhin kann ich daruch problemlos mit anderer Software weiterarbeiten und Gigapixel im Hintergrund vor sich hintrödelnd lassen – oder während der Berechnung zehn Kaffee trinken gehen – also inklusive Fahrt in die Stadt, Verabredung mit Freunden und einem Fahrradausflug an den Rhein. 😉
Ich hoffe, dass Topaz hier bis zum Ende der Betaphase noch massiv nachbessern kann.
Cloudberechnung
Vielleicht will Topaz diese Langsamkeit aber auch gar nicht beheben, denn die Firma bietet jetzt auch „Cloud renders“ mit einem Credit und Abo-System an, mit dem das Berechnen natürlich viel schneller geht. Damit sind wir aber dann schon – zusätzlich zum Kaufpreis von Gigapixel 8 – in ähnlichen Preisregionen wie Magnific.ai:
Lobend zu erwähnen, ist hier aber, dass Topaz auch das Kaufen von Credits erlaubt – also nicht ausschließlich auf ein Abo-Modell setzt. Das ist eine sehr faire Lösung für Gelegenheitsanwender, die ihre Bilder nur online skalieren lassen, wenn es mal schneller gehen soll. Diese gekauften Credits verfallen auch nicht – anders als bei Magnific.ai.
Mit der Installation von Topaz Gigapixel 8 erhält man 100 Credits zum Ausprobieren. Für wie viele Skalierungen dieses Kontingent reicht, hängt von der Endgröße der Skalierung ab:
Auch diese Aufteilung erscheint mir sehr fair zu sein.
TIPP: Oft reicht es, ein per KI erzeugtes Bild mit dem Faktor 1 zu skalieren (also die Bildgröße beizubehalten und mit Gigapixels Redefine-Model per cloud-render nur schnell Details und Verbesserungen hinzufügen zu lassen und das Ergebnis daraus dann mit einem der anderen, deutlich schnelleren KI-Modelle von Gigapixel lokal auf dem eigenen Rechner zu vergrößern. 100 Cloud-Credits (für 25 US-Dollar) würden so für das Verbessern von 50 bis 100 Bildern reichen.
Fazit
Topaz Gigapixel ist seinen Preis von 99 US-Dollar wert, wenn Sie häufiger einen Upscaler benötigen. Die Standard-KI-Modelle sind bereits ziemlich gut. Das neue generative Modell ist leider sehr langsam und wird hoffentlich noch bis zum Ende der Beta-Phase verbessert und beschleunigt. Das Cloud-Rendering ist schneller, verursacht aber zusätzliche Kosten und erfordert, dass Sie Ihre Bilder im Hintergrund auf einen Server hochladen lassen.
Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.
Ich verfolge die Fähigkeiten von Topaz seit der Version 4 und machte immer die Erfahrung, dass die besten Ergebnisse nicht mit Fotos sondern bei gezeichneten, gemalten oder gerenderten Bildern, beispieldweise Screenshots von Spielen, erreicht werden. Ist verständlich, denn solche Vorlagen sind nicht wirklich detailreich.
Außerdem liefert es die besten Ergebnissen bei Gesichtern. Ist aber verständlich, da sich die Modelle auf einen kleinen aber wichtigen Teil der realen Welt von Fotos konzentrieren können. Bereiche der Umgebung, egal ob Häuser-, Geschäfts- oder Landschaftsteile sind zu vielfältig und können in Details nicht auf die unzähligen und vielfältigen Objekte der realen Welt Bezug nehmen. Selbst Schriften werden nicht lebar generiert. Das bleibt nach wie vor den Labors der CSI vorbehalten.
Magnific.ai generiert aus der Vorlage einer Zeichnung von Lara Croft ein Bild, für das es eben beim Durchstöbern von unzähligen Bildern ein passendes Vorbild gefunden hat. Also keine echte Vergrößerung einer Vorlage, nur die Pose wurde übernommen.
Trotzdem liefert Gigapixel AI seit Jahren beständig beste Ergebnisse bei Vergrößerungen mit Einstellungsmöglichkeiten in Bereiche die man mögen kann, oder eben nicht. Doch das ist ja der Vorteil von Reglern. Man muss sie nicht bis zum Anschlag verwenden.
Ich nutze für mich unter Linux mit einer (RTX 4090) ComfyUI mit dem Flux Upscaler auf 8K, der auch etwas länger braucht, aber die Ergebnisse sprechen für sich. Der Vorteil ist, dass es zwar kostenlos ist, aber mit etwas Konfigurationsarbeit verbunden ist und die Ergebnisse wirklich zu gebrauchen sind. https://openart.ai/workflows/cychenyue/flux-controlnet-upscale/XsEKTG1cvnRXYdsPsQVc