Notebookcheck Logo

Pyramid Flow, ein Open-Source-KI-Videogenerator ist jetzt verfügbar

Standbild aus einem mit Pyramid Flow erstellten Text-zu-Video-Kurzfilm (Bildquelle: Pyramid Flow auf GitHub)
Standbild aus einem mit Pyramid Flow erstellten Text-zu-Video-Kurzfilm (Bildquelle: Pyramid Flow auf GitHub)
Das aus China stammende Pyramid Flow ist ein Open-Source-KI-Modell, das hochauflösende virtuelle Videos (768p) erstellen kann. Nach Angaben des dahinter stehenden Teams ist das Modell in der Lage, ein fünf Sekunden langes 384p-Video in weniger als einer Minute zu generieren. Pyramid Flow steht unter der MIT-Lizenz und wurde mit Open-Source-Datensätzen trainiert.

Pyramid Flow ist ein neues KI-Modell, das bereits in YouTube-Tutorial-Videos an Popularität gewonnen hat. Es wurde auf Open-Source-Datensätzen mit insgesamt rund 10 Millionen Videos trainiert. Pyramid Flow ist das Ergebnis eines Teams von KI-Forschern der Peking University, Kuaishou Technology und der Beijing University of Posts and Telecommunications und ist selbst Open-Source. Es unterliegt den Bedingungen der MIT-Lizenz und kann virtuelle hochauflösende (768p) Videoinhalte generieren. Besonders gut schneidet es jedoch bei der Verarbeitung von 384p-Videos ab. Laut seinen Entwicklern kann das Modell ein fünf Sekunden langes Video in weniger als einer Minute erstellen (unter Verwendung eines A100-Grafikprozessors in einer nicht spezifizierten Hardwarekonfiguration).

In bestimmten Szenarien übertrifft Pyramid Flow seine Konkurrenten. Bei der Bearbeitung bestimmter Textaufforderungen sind die Ergebnisse jedoch nicht immer zufriedenstellend. Wie bei vielen generativen KI-Anwendungen ist auch hier ein gewisses Maß an Zufälligkeit im Spiel. Ein großer Vorteil ist, dass das Modell wesentlich weniger Rechenleistung benötigt als vergleichbare Systeme, und da sein Code quelloffen ist, kann es von jedem in lokalen oder Cloud-Anwendungen eingesetzt werden, ohne Lizenzierungsprobleme zu verursachen.

Obwohl die KI-Forscher, die Pyramid Flow entwickelt haben und alle für das Training verwendeten Datensätze offengelegt haben, gibt es bisher keine Informationen zu möglichen Urheberrechtsfragen. Während einige Urheber von Inhalten behaupten, dass virtuelle Videos, die mithilfe von Open-Source-Material erstellt wurden, die Rechte von Urheberrechtsinhabern verletzen könnten, bietet Pyramid Flow dennoch Potenzial, um solche Inhalte präzise abzustimmen, ohne dass externe Parteien involviert werden müssen.

Interessierte, die sich mit KI aus einer Open-Source-Perspektive befassen möchten, können sich das Buch Open-Source AI: The Future of Data Research von J.D. TjonWolf bei Amazon für 9,22 Euro (Kindle) oder 12,59 Euro (Taschenbuch) sichern.

Quelle(n)

Keine Kommentare zum Artikel

Fragen, Anregungen, zusätzliche Informationen zu diesem Artikel? - Uns interessiert Deine Meinung (auch ohne Anmeldung möglich)!
Keine Kommentare zum Artikel / Antworten

static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2024-10 > Pyramid Flow, ein Open-Source-KI-Videogenerator ist jetzt verfügbar
Autor: Codrut Nistor, 15.10.2024 (Update: 15.10.2024)