Blog

Die (fotorealistische) Zukunft der Kommunikation?

Olaf Giermann8. Dezember 2023

2 Minuten Lesezeit

Vielleicht erinnern Sie sich noch an die Vorstellung der lächerlich-kruden Avatare für das Metaverse. Das genaue Gegenteil davon sind jetzt die von Metas Codec Avatars Lab vorgestellten „Relightable Gaussian Codec Avatars“. Diese Echtzeit-Repräsentationen von Gesichtern könnten nun tatsächlich die Zukunft der Kommunikation zeigen.

Was vorletztes Jahr im 90er-Jahre-Look begann, könnte schon bald für Jeden fotorealistisch aussehen. Die (fotorealistische) Zukunft der Kommunikation? — Was vorletztes Jahr im 90er-Jahre-Look begann, könnte schon bald für Jeden fotorealistisch aussehen.

Relightable Gaussian Codec Avatars = Telepräsenzen

Ein Running Gag bei Videokonferenzen ist, dass die Teilnehmer in Unterhosen teilnehmen und nur im für die Webcam sichtbaren Ausschnitt formelle Kleidung tragen. Für Telekonferenzen per Webcam muss man zwar nicht mehr aus dem Haus gehen, aber hübsch machen muss man sich doch noch ein wenig. Telepräsenzen, kurz: Avatare, würden das überflüssig machen – und auch ein von der Realität abweichendes Aussehen ermöglichen.

Das vom Meta-Konzern propagierte Meta-Verse würde Menschen aus aller Welt in einer virtuellen Umgebung zusammenbringen. Avatare wären dabei virtuelle schwebende Oberkörper als Repräsentationen der Teilnehmer. Was Meta und Chef Mark Zuckerberg als erste Variante präsentierten, wurde als völlig aus der Zeit gefallen belächelt und jeder fragte sich, was man damit wohl anfangen solle (mehr Informationen, Englisch).

© Meta Links die erste Variante eines Metaverse-Avatars, rechts eine verbesserte. Ernsthafte Kommunikation ist damit schwerlich denkbar. Die (fotorealistische) Zukunft der Kommunikation? — © Meta: Links die erste Variante eines Metaverse-Avatars, rechts eine verbesserte. Ernsthafte Kommunikation ist damit schwerlich denkbar.

Relightable Gaussian Codec Avatars

Heute bin ich über ein Forschungs-Paper des Codec Avatars Lab von Meta gestolpert (Link, Englisch), bei dem mir die Kinnlade herunterfiel, nachdem ich verstanden hatte, was ich dort sah.

Echtzeit generierte Avatare mit einzigartigen Ausdrückes, Blicken und Beleuchtungen mit Global Illumination und realistischen Reflexionen bis ins kleinste Detail. — In Echtzeit generierte Avatare mit einzigartigem Gesichtsausdruck und Blick. Beleuchtungen mit Global Illumination und realistischen Reflexionen bis ins kleinste Detail.

Was ich zunächst für die Referenzvideos echter Darsteller hielt, waren bereits die generierten Avatare. Sie müssen sich die Videos anschauen, um deren Wirkung beurteilen zu können. Man muss schon genau hinschauen, um die Unterschiede zu echtem Videomaterial zu sehen.

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Anders als früher musste hier kein aufwendiges 3D-Modell erzeugt werden, das dann texturiert, animiert und beleuchtet wird. Die hier verwendete „Gaussian Splatting“-Technik ähnelt den technisch verwandten „neural radiance fields“ (Nerfs), kann im Gegensatz zu diesen jedoch in Echtzeit berechnet werden. Stark vereinfacht handelt es sich um eine dreidimensionale Repräsentation einer Szene, die mit Deep-Learning-Algorithmen aus wenigen zweidimensionalen Fotos erzeugt wurde.

Ein Schema der angewandten Methode. Ja, es ist kompliziert. ;-). Die (fotorealistische) Zukunft der Kommunikation? — Ein Schema der angewandten Methode. Ja, es ist kompliziert. 😉

Statt eines (zeit-)aufwendigen und detaillierten 3D-Scans bedarf es so nur einiger Fotos für eine fotorealistische Telepräsenz. Und das ist natürlich spannend, da so jeder mit einem Smartphone in die Lage versetzt wird, einen solchen Avatar von sich zu erzeugen.

Im Hinblick auf die Verwendung von VR-Headsets wie der Meta-Quest ist natürlich auch die relativ geringe erforderliche Rechenleistung von Vorteil. Zusammen mit der Augen und Gesichtserkennung dieser Geräte kann die Mimik verzögerungsfrei auf den Avatar übertragen werden.

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Das vorgestellte Gauß-Splatting erlaubt eine extrem realistische Beleuchtung der Avatare – selbst feinste Details wie einzelne Haarsträhnen und Poren werden realistisch wiedergegeben und reagieren auf wechselnde Lichtverhältnisse.

Gesichtsausdruck, Blick, Ausrichtung und Beleuchtung sind unabhängig voneinander steuerbar.

Drei verschiedene Parameter können Sie testweise auf https://shunsukesaito.github.io/rgca/einstellen. — Drei verschiedene Parameter können Sie testweise auf https://shunsukesaito.github.io/rgca/ einstellen.

Die Forscher demonstrieren die Machbarkeit ihres Ansatzes mit einem Standard-PC-VR-Headset aus verschiedenen Blickwinkeln, mit unterschiedlichen Beleuchtungsarten. Das folgende Video zeigt die für Kommunikation entwickelte Technologie in Aktion.

Weitere Informationen und Videos finden Sie auf der Website des Forschungsprojekts: https://shunsukesaito.github.io/rgca/

Im DOCMAshop finden Sie alle Infos zum aktuellen Heft: Das ausführliche Inhaltsverzeichnis sowie einige Seiten als Kostprobe.

Schlagworte

Olaf Giermann8. Dezember 2023

2 Minuten Lesezeit

Zeig mehr

hubertus0
Danke, Herr Kieckhöfel, ich denke, dass ich zunächst mal mit...
Bernd Kieckhöfel
Wenn sich das so pauschal beantworten ließe, hätte ich kein...
hubertus0
Sie machen mich neugierig ;-) Liegen denn Erkenntnisse vor,...
wieland
Sehr schöner Artikel!!! Es ist einfach so: Ich mag Pixelstru...
Michael J. Hußmann
Hier können zwar keine Bilder hochgeladen werden, aber einge...

Die (fotorealistische) Zukunft der Kommunikation?

Relightable Gaussian Codec Avatars = Telepräsenzen

Relightable Gaussian Codec Avatars

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Olaf Giermann

Schreiben Sie einen Kommentar Antworten abbrechen

Bild-KI als virtuelle Kamera?

Makrofotografie

Interview mit einem Buch: Posing

Das Märchen von den guten Filmen und den bösen Pixeln

Das Buch: Die Geheimnisse perfekter Prompts

Kunst (besser) verstehen

Werkzeuge wechseln

Luminar Neo: Das Panorama-Plug-in

Leser fragen: Drunter und drüber

Hintergrundauswahl

Generative KI: Steampunk für Dummies

Pinselspitzen interaktiv einstellen

Wasserzeichen einfügen

Personen hinzufügen

Daniel Spohn im Interview: Winterlandschaften fotografieren

Relightable Gaussian Codec Avatars = Telepräsenzen

Relightable Gaussian Codec Avatars

Gaussian Splatting – ohne 3D-Drahtgittermodell zu Relightable Gaussian Codec Avatars

Unabhängige Parameter und hochpräzise Beleuchtung der Relightable Gaussian Codec Avatars

Olaf Giermann

Ähnliche Artikel

Superresolution oder warum die Impressionisten keine KI brauchten

KI- und Qualitätsprobleme in Photoshop 2025?

Topaz Gigapixel 8 – Bildvergrößerung und -verbesserung jetzt auch mit generativen Funktionen

Canva/Affinity – die Adobe-Konkurrenz?

Schreiben Sie einen Kommentar Antworten abbrechen