Produzent des KI-Kurzfilms Air Head: Sora von OpenAI erfordert hunderte von Prompts und viel VFX-Arbeit ↺
Als OpenAI seine Videogenerator-KI Sora ankündigte, war eines der Videos, die zur Demonstration seiner Fähigkeiten verwendet wurden, der Kurzfilm Air Head von Shy Kids. Während das Video zunächst als beeindruckende Demonstration des OpenAI-Modells angepriesen wurde, zeigt ein kürzlich von FX Guide geführtes Interview mit Shy Kids, dass weitaus mehr Arbeit in das Video geflossen ist, als viele dachten.
Obwohl Soras Fähigkeiten zweifellos beeindruckend sind und noch vor ein oder zwei Jahren fast unmöglich gewesen wären, benötigte das Team von Shy Kids fast zwei Wochen, um Air Head zu erstellen - hauptsächlich aufgrund der Beschränkungen der KI. Eine der größten Hürden, auf die Shy Kids bei Sora stieß, war der fehlende Sinnzusammenhang des KI-Materials, der das Produktionsteam dazu zwang, eine unorthodoxe Schnittmethode anzuwenden, ähnlich wie bei der Produktion eines Found-Footage-Films oder einer Dokumentation.
Es ging einfach darum, eine ganze Reihe von Aufnahmen zu machen und zu versuchen, sie so zu schneiden, dass sie für das Publikum interessant waren. - Patrick Cederberg, Postproduktion bei Air Head
Shy Kids sagt, dass sie ein Drehbuch für das Video hatten, aber das Team musste sich eher an Soras variablen Output anpassen. Shy Kids hatte auch Schwierigkeiten, die Dinge von einer Aufnahme zur nächsten konsistent zu halten, da Sora oft eine andere Art von Kopf auf den Ballon zauberte. Insgesamt, so Cederberg, waren "Hunderte von KI-Generierungen" erforderlich, um fast eineinhalb Minuten Material für das Video zu schneiden. Er schätzt auch, dass das Verhältnis zwischen dem Ausgangsmaterial und dem endgültigen Inhalt 300:1 betrug, was bedeutet, dass Shy Kids nur etwa 0,33 % des von Sora produzierten Videos für den endgültigen Schnitt verwendete.
Die Arbeit mit Sora bedeutete jedoch nicht nur, Hunderte von Clips zu produzieren. Das Team musste auch alle üblichen Aufgaben wie Farbkorrektur, Retiming und sogar VFX durchführen, um unerwünschte Elemente aus dem Bild zu entfernen. In einem der Clips gab Sora einen Luftballon aus, auf dessen Vorderseite ein Gesicht aufgedruckt war. In anderen Clips hatte der Luftballon verschiedene Farben oder eine unerwünschte Schnur hing von der Unterseite des Ballons herab - all dies musste entfernt werden.
Obwohl Sora und generative KI-Videos bereits einen langen Weg der Entwicklung hinter sich haben, sind sie noch weit davon entfernt, die Künstler hinter den Kulissen zu ersetzen, insbesondere wenn der produzierte Inhalt kohärent sein oder länger als ein paar Sekunden dauern soll. Dies erklärt wahrscheinlich, warum mit Ausnahme von zweien alle "unbearbeiteten" Clips, die OpenAI auf seiner Sora-Seite veröffentlicht hat, eine Länge von 20 Sekunden oder weniger haben.