(华盛顿16日综合电)创造聊天机器人ChatGPT和图像生成器DALL-E的科技公司OpenAI于15日透露,公司正在测试一款可由文本或静态图片生成逼真视频的模型Sora。
OpenAI在部落格贴文中表示,Sora能生成长达1分钟的视频,同时维持视觉品质,并符合用户的指令,并释出数段通过文字输入指令而生成的视频。
OpenAI执行长奥特曼(Sam Altman)在社群媒体X上表示,公司在测试阶段向数量有限的创作者提供存取权限。

奥特曼也邀请用户在X上提出指令建议,几分钟后在这个平台上张贴颇具说服力的视频生成结果,其中包括两只黄金猎犬在山上开串流Podcast、老奶奶在厨房教烹饪、动物在海上骑脚踏车,以及珠光宝气的动物园等。
还有另一支视频显示“半鸭半龙的生物飞驰在美丽的暮色中,背上骑着一只身着探险装备的仓鼠”。
然而OpenAI同时警告称,目前的Sora存有弱点,如左右不分,或未能在整段视频中维持视觉连贯性。
OpenAI也强调,安全性是一大关键,Sora将面临对抗性资安测试,期间特定用户会试图让平台失灵,产生不恰当的内容或出毛病,同时表示会接洽全球政策制定者、教育家和艺术家,以了解他们的顾虑,并找出这种新技术的正面使用案例。
面子书母公司Meta、谷歌(Google)和Runway AI也在研发文本生成视频的AI技术,并已公布类似的工作样本。
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
文:综合
图:视频截图
视频:OpenAI
阅读更多精彩文章 马上浏览独家配套
文章评论