1. Zum Inhalt springen
  2. Zur Hauptnavigation springen
  3. Zu weiteren Angeboten der DW springen

OpenAI präsentiert KI-Generator für Videos aus Texten

16. Februar 2024

Das KI-Unternehmen OpenAI hat eine Software vorgestellt, die in Sekundenschnelle Videos aus Text-Vorgaben erzeugen kann. Das Tool Sora ist allerdings noch nicht öffentlich zugänglich.

 Eine Bildschirmansicht zur Präsentation des Video-Generators Sora von OpenAI
Eine Bildschirmansicht zur Präsentation des Video-Generators Sora von OpenAIBild: CFOTO/picture alliance

Die Firma OpenAI aus San Francisco hat eine Anwendung entwickelt, die mit Hilfe von Künstlicher Intelligenz (KI) realistische Videos herstellt. Die Anwendung namens Sora könne anhand eines kurzen Befehls in Textform, eines sogenannten Prompts, Videos mit einer Länge von bis zu einer Minute von hoher Qualität herstellen, teilte OpenAI mit. Die Anwendung könne auch aus einem Foto ein Video machen oder ein kurzes Video verlängern. Die Firma wurde vor allem durch den Chatbot ChatGPT und den Bildgenerator Dall-e bekannt.

Aktuell könne eine "begrenzte Zahl von Künstlern" die Anwendung testen, sagte Firmenchef Sam Altman. Auch sollen Experten mögliche Sicherheitsrisiken ausloten, bevor das Programm breit genutzt werden kann. Altman forderte dazu auf, Vorschläge auf der Plattform X, ehemals Twitter, zu machen; Sora werde nur Augenblicke später "überzeugende Ergebnisse" präsentieren.

OpenAI-Chef Sam Altman, hier in einem Videocall bei einer Konferenz in DubaiBild: Ryan Lim/AFP/Getty Images

Auf der Website zur Software veröffentlichte OpenAI mehrere Beispiele zusammen mit der Beschreibung, die ihnen zugrunde liegt. Als ein Beispiel wird ein Video gezeigt, in dem ein Wesen "halb Ente, halb Drachen" vor einem "wunderschönen Sonnenuntergang" fliegt und dabei einen "Hamster im Abenteuer-Outfit" auf dem Rücken trägt. Andere Videos zeigen unter anderem Mammuts, die im Schnee laufen, sowie eine Stadt in Kalifornien zu Zeiten des Goldrauschs.

Derzeit noch Schwächen und Fehler

Der bekannte Youtuber MrBeast schlug vor, Altman solle das Video eines Affen kreieren, der in einem Park Schach spielt. Das Ergebnis - eine Art Makak mit einer roten Kappe, der auf einem Picknicktisch vor einem Schachbrett hockt und seinen Kopf zur Kamera dreht - wirkt durchaus realistisch. Allerdings stimmen etwa die Dimensionen der Schachfiguren nicht, auch sind zwei weiße Könige zu sehen.

OpenAI räumte ein, dass Sora in seiner aktuellen Entwicklungsstufe noch Schwächen habe. So mache das Programm manchmal Fehler bei der Umsetzung von Regeln der Physik. Außerdem verwechsle es zum Beispiel noch rechts und links. Auch bei der Kontinuität hapere es noch - "zum Beispiel beißt ein Mensch in einen Keks, aber der hat dann keine Bissspuren". MrBeast zeigte sich dennoch beeindruckt. "Sam, mach mich bitte nicht obdachlos", kommentierte er auf X.

KI: Jobkiller oder hilfreicher Kollege?

01:22

This browser does not support the video element.

Werden Bedenken und Sorgen aufgegriffen?

Das Unternehmen versicherte, es nehme die Sicherheit und die Sorgen der Menschen sehr ernst. "Wir werden mit politischen Entscheidungsträgern, Pädagogen und Künstlern auf der ganzen Welt zusammenarbeiten, um ihre Bedenken zu verstehen und positive Anwendungsfälle für diese neue Technologie zu identifizieren", erklärte das Unternehmen.

OpenAI schließt mit der neuen Software eine Lücke in seinem Angebot. Die Konkurrenten Meta, Google und Runway AI arbeiten an ähnlichen Anwendungen und haben bereits erste Versionen davon veröffentlicht. 49 Prozent der Geschäftsanteile an OpenAI werden vom US-Konzern Microsoft gehalten.  

Die KI-Technologie, die bewegte Bilder aus Text-Vorgaben generiert, könnte mit der Zeit die heutige Videoproduktion verändern. Zugleich sind die Sorgen groß, dass damit in großem Stil Fake-Videos erzeugt werden können, die von echten Aufnahmen kaum zu unterscheiden wären. Die Entwickler der Technologie arbeiten deshalb an Wegen, in die Videos eindeutige Erkennungsmerkmale wie Wasserzeichen einzubauen. Auch bei Sora-Videos solle erkennbar sein, dass sie von KI erzeugt wurden.

ChatGPT löste vor gut einem Jahr den aktuellen Hype um Künstliche Intelligenz aus. Genauso wie solche KI-Chatbots wird auch die Software zum Erzeugen von Fotos und Videos mit gewaltigen Mengen an Informationen angelernt.

kle/se (afp, dpa, ape)