OpenAI 推出视频 AI 模型 Sora,能够生成 60 秒的视频片段

647次阅读
2 条评论

共计 1443 个字符,预计需要花费 4 分钟才能阅读完成。

原作者:Carl Franzen
文章出处:https://venturebeat.com/ai/openai-unveils-video-ai-model-sora-capable-of-generating-60-second-videos/
编译:裴先生笔记

OpenAI 并不满足于只被称为 ChatGPT 甚至是 LLM 公司:今天,它发布了其新的人工智能文本到视频生成模型Sora的演示,联合创始人兼首席执行官山姆-阿尔特曼(Sam Altman)在 X(前 Twitter)上发帖称,这是一个 “非凡的时刻”。

虽然由于 Altman 在帖子中所说的 “red-teaming”,即对其安全防御、缺陷和误用的对抗性测试,该产品还不能正式供大众使用,但这位创始人确实指出,该产品将提供给 “有限数量的创作者”,并将在晚些时候向公众推广。

视频人工智能模型领域竞争激烈

Sora 正在进入一个竞争激烈的领域,现有的竞争对手初创公司RunwayPikaStability AI都提供了专门的人工智能视频生成模型,谷歌等中坚力量也展示了其 Lumiere 模型功能。

不过,OpenAI 今天分享的 Sora 视频样本在分辨率的清晰度、动作的流畅性、人体解剖学和物理世界的准确性,以及最重要的运行时间方面都非常突出。

Sora video. Credit: OpenAI

Runway 和 Pika 一次只能生成 4 秒钟的视频,还可以选择扩展,而 OpenAI 的 Sora 则不同,它可以直接生成 60 秒钟的视频。

Altman和 OpenAI 领导层以及Sora 团队的其他成员(包括研究员 Will Depue)正在 Twitter/X 上收集用户的提示信息,他们正在通过 Sora 对这些信息进行处理,作为该模型新功能的现场众包演示。因此,如果您有兴趣的话,可以向他们提交一些资料(我已经提交了)。

比起那些天马行空的视频,索拉还能复制人类生活中平凡而又可识别的瞬间,比如从高架列车上观看城市景观,或者一个女人和一只猫在床上的家庭录像,这些视频的逼真程度令人震惊。

Sora video. Credit: OpenAI
Sora video. Credit: OpenAI

同样令人印象深刻且可能令人震惊的是,OpenAI 研究员比尔-皮布尔斯(Bill Peebles)指出,Sora 将通过 “模拟一切 “来帮助人们探索 AGI。

在美国联邦机构再次推动对人工智能进行监管,特别是针对其欺诈和深度伪造真人的可能性之际,Sora 的出现似乎不仅是 OpenAI 的一个里程碑,也是整个科技和媒体行业乃至整个人类的一个里程碑–不过是好是坏,还有待观察。

正文完
 
裴先生
版权声明:本文于2024-02-18转载自OpenAI unveils video AI model Sora capable of generating 60-second clips,共计1443字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(2 条评论)
Pampo 评论达人 LV.1
2024-02-18 16:52:11 回复

AI 发展好快啊,去年这个时候 ChatGPT 才刚刚出来,现在就已经有视频 ai 了,以后可能就是 ai 的天下了

 Android  Chrome  中国广东省深圳市电信
    裴先生 博主
    2024-02-18 17:18:23 回复

    @Pampo 是的,如今视频AI出来了,抖音段子手们感觉也要被替代了,更远的未来一部分人进去数字世界,一部分人跟随地球去流浪

     Macintosh  Chrome
本站勉强运行: