2月16日,OpenAI推出其首款文生视频大模型Sora。该模型能根据提示词生成长达1分钟的视频,或者扩展生成的视频使其更长,同时视觉质量相当惊艳。
19213348-woman.gif
相比以往的视频模型,Sora的亮点非常明显,不仅对文本理解更深刻,可以准确地呈现提示词,而且能在一个生成的视频中创建多个镜头,准确地保留角色和视觉风格。
19213428-cat.gif
尤其值得一提的是,Sora在细节处理上做得非常出挑,能够理解复杂场景中不同元素之间的物理属性及其关系,正确呈现它们在物理世界中的存在方式。
19214045-dog.gif
除了支持文本指令输入外,该模型支持生成图像,也支持将现有静止图像变成视频,能对现有视频进行扩展、将两个视频衔接并填充缺失的帧。
其3D仿真能力非常突出,无论是制作短视频、动画、电影画面,还是渲染视频游戏,Sora都展示出了令人期待的落地前景。
19214139-cartoon.gif
为了全方位展示Sora的水平,OpenAI一口气放出了48个用Sora直接生成、未经修改、长度不等(9秒~60秒)的视频。

OpenAI将Sora称作是“能够理解和模拟现实世界的模型的基础”,相信其能力“将是实现AGI的重要里程碑”。

行业影响

而关于Sora发布后的影响,一些圈内人士也陆续发表了他们的观点。

360创始人周鸿祎在微博长文中表示,Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。同时,科技竞争本质上比拼还是人才的密度和深厚积累,Sora效果吊打Pika和Runway很正常,有人认为有了AI以后,创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。

此外,前阿里技术副总裁、目前正在从事AI架构创业的贾扬清也针对Sora在朋友圈发布了他最新的观点。他认为此次Sora确实非常厉害,而Sora将带来的影响包括以下几点:“1.对标OpenAI的公司有一波被其他大厂fomo收购的机会。2.长线闭源寡头,开源还需要一段时间才能追赶上。3. 从算法小厂的角度,要不就算法上媲美OpenAI,要不就垂直领域深耕应用,要不就选择开源。4.基础设施的需求继续会猛增。”

官网:https://openai.com/sora
技术报告:https://openai.com/research/video-generation-models-as-world-simulators