Fotos aus Text: Nvidias KI-basiertes GauGAN2 erstellt Bilder anhand einzelner Worte
Seit über zwei Jahren erlaubt GauGAN2, aus einfachen Kritzeleien Fotos von Landschaften, Pflanzen und Gebäuden zu erstellen. Aus diesen Segmentation Maps mit selbst eingezeichneten Bereichen werden dank künstlicher Intelligenz entsprechende Bilder erschaffen.
In einem aktuellen Blogbeitrag stellt Nvidia jetzt eine neue Funktion der GauGAN2 Beta vor: Als Vorgabe genügt nunmehr eine einfache Phrase, die die KI in ein Foto umwandelt. Das funktioniert mit nahezu allen denkbaren Kombinationen von "ocean waves at sunset" bis zu "dunes in the winter".
Die AI dahinter greift laut Nvidia auf etwa zehn Millionen Landschaftsaufnahmen zurück und nutzt die Rechenleistung des Nvidia Selene Supercomputers. Mithilfe eines neuronalen Netzwerks werden die einzelnen Worte in Beziehung zueinander gesetzt, um immer neue Fotos zu kreieren, die sich mit jeder weiteren Information verändern.
Die Beta-Version erlaubt einen interessanten Einblick in die Funktionsweise der Software. Je mehr Information zur Verfügung gestellt werden, um so detaillierter gestaltet sich das Endergebnis. Das gelingt vor allem dann, wenn neben der reinen Texteingabe auch die Segmentation Map oder ein zusätzliches Foto als Grundlage bereitgestellt werden.
Dank einer kurzen Einführung und eines Erklärvideos ist die Bedienung schnell erlernt. Abseits von Landschaftsmotiven verwandeln sich die kreierten Fotos allerdings schnell in eher fantastische Bilder weit abseits der Realität. Nichtsdestotrotz lohnt es sich, das Programm auszuprobieren. Wie neue Eingaben das Foto verändern oder ein Klick auf die Würfel das Ergebnis ganz neu erschafft, dürfte auch das Funktionsprinzip von AI etwas greifbarer machen.