Fotos aus Text: Nvidias KI-basiertes GauGAN2 erstellt Bilder anhand einzelner Worte

Eine Wortgruppe genügt und die AI der Nvidia GauGAN2 Beta kreiert daraus ein recht überzeugendes Foto. (Bild: Nvidia Research)

Nvidia Research stellt eine neue Funktion seiner künstlichen Intelligenz für Bilderstellung und- bearbeitung vor. Eine Wortgruppe genügt und die AI präsentiert ein fotorealistisches Bild. Passt das Wetter nicht, ist es in zehn Zeichen geändert.

Mario Petzold, Veröffentlicht am 25.11.2021

AI GPU Geforce Software

Seit über zwei Jahren erlaubt GauGAN2, aus einfachen Kritzeleien Fotos von Landschaften, Pflanzen und Gebäuden zu erstellen. Aus diesen Segmentation Maps mit selbst eingezeichneten Bereichen werden dank künstlicher Intelligenz entsprechende Bilder erschaffen.

In einem aktuellen Blogbeitrag stellt Nvidia jetzt eine neue Funktion der GauGAN2 Beta vor: Als Vorgabe genügt nunmehr eine einfache Phrase, die die KI in ein Foto umwandelt. Das funktioniert mit nahezu allen denkbaren Kombinationen von "ocean waves at sunset" bis zu "dunes in the winter".

Die AI dahinter greift laut Nvidia auf etwa zehn Millionen Landschaftsaufnahmen zurück und nutzt die Rechenleistung des Nvidia Selene Supercomputers. Mithilfe eines neuronalen Netzwerks werden die einzelnen Worte in Beziehung zueinander gesetzt, um immer neue Fotos zu kreieren, die sich mit jeder weiteren Information verändern.

"stormy day" addiert Wolken, Nebel und Wellen, die in der Zeichnung nicht auftauchen.

Die Beta-Version erlaubt einen interessanten Einblick in die Funktionsweise der Software. Je mehr Information zur Verfügung gestellt werden, um so detaillierter gestaltet sich das Endergebnis. Das gelingt vor allem dann, wenn neben der reinen Texteingabe auch die Segmentation Map oder ein zusätzliches Foto als Grundlage bereitgestellt werden.

Dank einer kurzen Einführung und eines Erklärvideos ist die Bedienung schnell erlernt. Abseits von Landschaftsmotiven verwandeln sich die kreierten Fotos allerdings schnell in eher fantastische Bilder weit abseits der Realität. Nichtsdestotrotz lohnt es sich, das Programm auszuprobieren. Wie neue Eingaben das Foto verändern oder ein Klick auf die Würfel das Ergebnis ganz neu erschafft, dürfte auch das Funktionsprinzip von AI etwas greifbarer machen.

Quelle(n)

Nvidia Blog

Verwandte Artikel

Loading Comments

Diesen Artikel kommentieren / Antworten

⟨

Ältere News

Platz 1 für die GeForce-RTX-3050-Laptop-GPU des Gigabyte G5 GD

Neuere News

Deal: Amazon bietet Lenovo-Tablets zu Bestpreisen, schon ab 87 Euro

⟩

Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!

Mario Petzold - Tech Writer - 534 Artikel auf Notebookcheck veröffentlicht seit 2021

Seit 1989 und einem Intel 8086 nutze ich Computer. Auch das Internet kenne ich noch, bevor College- und Uni-Netzwerke durch Firmen und Social Media verdrängt wurden. Die Faszination für die technischen Sprünge und gesellschaftlichen Auswirkungen ließ mich nicht mehr los. Insbesondere dem klassischen PC gilt mein größtes Interesse - und kaum weniger dem Laptop, in dem die Komponenten sich mit wenig Platz und Strom arrangieren müssen. So erscheint es nur konsequent, dass ich seit 2015 technische Ratgeber und Produktvorstellungen schreibe. Für das nötige Grundlagenwissen und das Verständnis für Zusammenhänge sorgt mein Physikstudium.

Kontakt: LinkedIn

> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2021-11 > Fotos aus Text: Nvidias KI-basiertes GauGAN2 erstellt Bilder anhand einzelner Worte

Autor: Mario Petzold, 25.11.2021 (Update: 18.02.2026)