YouTube warnt OpenAI vor der Verwendung seiner Videos zum Training von KI-Modellen
ChatGPT ist vielleicht nicht mehr in aller Munde, aber mehr als ein Jahr nach der Einführung des Chatbots ist OpenAI wieder im Rampenlicht. Diesmal mit einem Text-to-Video-Modell namens Sora. Wie das Einführungsvideo zeigt, ist das Modell in der Lage, lebensechte Videos zu erstellen, mit denen man leicht jemanden täuschen kann.
All diese technologischen Fortschritte haben jedoch auch viele Fragen aufgeworfen, von denen die meisten die Trainingsdaten von OpenAI Sora betreffen. Ein Interview, das das Wall Street Journal kürzlich mit der CTO, Mira Murati, geführt hat, hat die Situation noch verschärft. Mira konnte keine konkrete Antwort auf die Frage geben, ob das Text-to-Video-Modell auf YouTube-Videos trainiert wurde.
Tatsächlich wusste CTO Mira Murati nicht, woher die Trainingsdaten von Sora stammten. In einem Interview mit Bloomberg Originals warnte Neal Mohan, CEO von YouTube, OpenAI, dass es nicht erlaubt sei, Videos von der Plattform zu verwenden, um Modelle zu trainieren.
Mohan erklärt: "Wenn ein Autor seine harte Arbeit auf unsere Plattform hochlädt, hat er bestimmte Erwartungen", und der YouTube-CEO fährt fort: "Eine dieser Erwartungen ist, dass die Nutzungsbedingungen eingehalten werden. OpenAI hat noch nicht auf den Fall reagiert.
Es gibt viele Kontroversen und Unsicherheiten darüber, wie OpenAI seine Modelle trainiert, darunter DALL-E, ChatGPT und Sora. Das Wall Street Journal berichtete sogar, dass das Unternehmen plant, Transkripte von YouTube-Videos zu verwenden, um GPT-5 zu trainieren, was wiederum gegen die Nutzungsbedingungen der Plattform verstoßen würde.
Googles multimodale KI Gemini benötigt ähnliche Daten. Wie Mohan erklärt, wird das Modell jedoch nur auf bestimmte Videos trainiert und hängt von den Genehmigungen ab, die der Urheber in seinem Vertrag erteilt hat (hier KI-gesteuerte Webcam OBSBOT Tiny 2 bei Amazon kaufen).