Notebookcheck Logo

Fotos aus Text: Nvidias KI-basiertes GauGAN2 erstellt Bilder anhand einzelner Worte

Eine Wortgruppe genügt und die AI der Nvidia GauGAN2 Beta kreiert daraus ein recht überzeugendes Foto. (Bild: Nvidia Research)
Eine Wortgruppe genügt und die AI der Nvidia GauGAN2 Beta kreiert daraus ein recht überzeugendes Foto. (Bild: Nvidia Research)
Nvidia Research stellt eine neue Funktion seiner künstlichen Intelligenz für Bilderstellung und- bearbeitung vor. Eine Wortgruppe genügt und die AI präsentiert ein fotorealistisches Bild. Passt das Wetter nicht, ist es in zehn Zeichen geändert.

Seit über zwei Jahren erlaubt GauGAN2, aus einfachen Kritzeleien Fotos von Landschaften, Pflanzen und Gebäuden zu erstellen. Aus diesen Segmentation Maps mit selbst eingezeichneten Bereichen werden dank künstlicher Intelligenz entsprechende Bilder erschaffen.

In einem aktuellen Blogbeitrag stellt Nvidia jetzt eine neue Funktion der GauGAN2 Beta vor: Als Vorgabe genügt nunmehr eine einfache Phrase, die die KI in ein Foto umwandelt. Das funktioniert mit nahezu allen denkbaren Kombinationen von "ocean waves at sunset" bis zu "dunes in the winter".

Die AI dahinter greift laut Nvidia auf etwa zehn Millionen Landschaftsaufnahmen zurück und nutzt die Rechenleistung des Nvidia Selene Supercomputers. Mithilfe eines neuronalen Netzwerks werden die einzelnen Worte in Beziehung zueinander gesetzt, um immer neue Fotos zu kreieren, die sich mit jeder weiteren Information verändern.

"stormy day" addiert Wolken, Nebel und Wellen, die in der Zeichnung nicht auftauchen.
"stormy day" addiert Wolken, Nebel und Wellen, die in der Zeichnung nicht auftauchen.

Die Beta-Version erlaubt einen interessanten Einblick in die Funktionsweise der Software. Je mehr Information zur Verfügung gestellt werden, um so detaillierter gestaltet sich das Endergebnis. Das gelingt vor allem dann, wenn neben der reinen Texteingabe auch die Segmentation Map oder ein zusätzliches Foto als Grundlage bereitgestellt werden.

Dank einer kurzen Einführung und eines Erklärvideos ist die Bedienung schnell erlernt. Abseits von Landschaftsmotiven verwandeln sich die kreierten Fotos allerdings schnell in eher fantastische Bilder weit abseits der Realität. Nichtsdestotrotz lohnt es sich, das Programm auszuprobieren. Wie neue Eingaben das Foto verändern oder ein Klick auf die Würfel das Ergebnis ganz neu erschafft, dürfte auch das Funktionsprinzip von AI etwas greifbarer machen.

Quelle(n)

static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
Mail Logo
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2021-11 > Fotos aus Text: Nvidias KI-basiertes GauGAN2 erstellt Bilder anhand einzelner Worte
Autor: Mario Petzold, 25.11.2021 (Update: 15.08.2024)