NVIDIA stellt das generative KI-Modell LATTE3D als "virtuellen 3D-Drucker" vor
Während KI-Modelle für die Bild- und Videogenerierung schon seit einiger Zeit die Medien beherrschen, hat NVIDIA mit LATTE3D, einem neuen generativen KI-Modell, das Texteingaben in weniger als einer Sekunde in vollständige 3D-Modelle verwandelt, einen Schritt in die nächste logische Richtung getan. Die Technologie, die auf der NVIDIA GTC letzte Woche angekündigt wurde, wird als eine Art "virtueller 3D-Drucker" angepriesen, der sofort 3D-Modelle "in einem populären Format, das für Standard-Rendering-Anwendungen verwendet wird", zur Verwendung in der Entwicklung von Videospielen, Werbung, Designprojekten oder jeder Anwendung, die eine virtuelle Umgebung erfordert, einschließlich VR und AR, liefert.
Generative Text-to-3D KI ist keine neue Technologie, und das Forschungsdokument von NVIDIA selbst stellt LATTE3D mehreren bestehenden Systemen wie MVDream, 3DTopia und LGM gegenüber. Der überwältigende Vorteil von LATTE3D ist seine Geschwindigkeit. In Vergleichstests benötigen andere KI-Modelle zwischen 20 Sekunden und 30 Minuten, um eine Ausgabe zu erzeugen, während LATTE3D eine vergleichbare (und oft bessere) Ausgabe in nur 400 Millisekunden liefert.
Wie beim 3D-Druck verbessert sich die Qualität der Ausgabe von LATTE3D und anderen KI-Modellen mit der Zeit. Der Vorteil besteht darin, dass man - anders als beim 3D-Druck - anfangs der Geschwindigkeit Vorrang vor der Qualität einräumen und später auf eine verfeinerte Ausgabe warten kann, anstatt die Parameter von Anfang an festzulegen.
Wie jede andere generative KI hat LATTE3D das Potenzial, viele Arbeitsabläufe zu verändern. Während es früher notwendig war, eine 3D-Asset-Bibliothek zu durchsuchen oder wertvolle Arbeitsstunden aufzuwenden, um ein einfaches Objekt zu erstellen, genügt es mit der Technologie von NVIDIA, eine kurze Beschreibung einzugeben und die generierte Ausgabe in die eigene Softwareanwendung oder Plattform zu importieren.
Bisher hat das Forschungsteam LATTE3D nur für die Modellierung von Alltagsgegenständen und Tieren trainiert, aber mit den richtigen Datensätzen kann es auf andere Kategorien erweitert werden. Das Modell wurde mit NVIDIA A100 Tensor Core GPUs trainiert und lief in der Demonstration des Unternehmens auf einer einzelnen NVIDIA RTX A6000.
Als Forschungsprojekt befindet sich LATTE3D noch in der Entwicklungsphase und es gibt noch keine Pläne, es als Produkt oder Dienstleistung auf den Markt zu bringen. Zu den Zukunftsplänen für das Projekt gehören die Erweiterung der Text-to-4D-Funktionalität oder die Erzeugung von 3D-Animationen.
Erleben Sie immersive virtuelle und Mixed-Reality-Umgebungen mit dem Meta Quest 3 Headset und der XREAL Air 2 Pro AR-Brille, die beide bei Amazon erhältlich sind.