共计 1443 个字符,预计需要花费 4 分钟才能阅读完成。
原作者:Carl Franzen
文章出处:https://venturebeat.com/ai/openai-unveils-video-ai-model-sora-capable-of-generating-60-second-videos/
编译:裴先生笔记
OpenAI 并不满足于只被称为 ChatGPT 甚至是 LLM 公司:今天,它发布了其新的人工智能文本到视频生成模型Sora的演示,联合创始人兼首席执行官山姆-阿尔特曼(Sam Altman)在 X(前 Twitter)上发帖称,这是一个 “非凡的时刻”。
虽然由于 Altman 在帖子中所说的 “red-teaming”,即对其安全防御、缺陷和误用的对抗性测试,该产品还不能正式供大众使用,但这位创始人确实指出,该产品将提供给 “有限数量的创作者”,并将在晚些时候向公众推广。
视频人工智能模型领域竞争激烈
Sora 正在进入一个竞争激烈的领域,现有的竞争对手初创公司Runway、Pika和Stability AI都提供了专门的人工智能视频生成模型,谷歌等中坚力量也展示了其 Lumiere 模型功能。
不过,OpenAI 今天分享的 Sora 视频样本在分辨率的清晰度、动作的流畅性、人体解剖学和物理世界的准确性,以及最重要的运行时间方面都非常突出。
Runway 和 Pika 一次只能生成 4 秒钟的视频,还可以选择扩展,而 OpenAI 的 Sora 则不同,它可以直接生成 60 秒钟的视频。
Altman和 OpenAI 领导层以及Sora 团队的其他成员(包括研究员 Will Depue)正在 Twitter/X 上收集用户的提示信息,他们正在通过 Sora 对这些信息进行处理,作为该模型新功能的现场众包演示。因此,如果您有兴趣的话,可以向他们提交一些资料(我已经提交了)。
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sam Altman (@sama) February 15, 2024
比起那些天马行空的视频,索拉还能复制人类生活中平凡而又可识别的瞬间,比如从高架列车上观看城市景观,或者一个女人和一只猫在床上的家庭录像,这些视频的逼真程度令人震惊。
同样令人印象深刻且可能令人震惊的是,OpenAI 研究员比尔-皮布尔斯(Bill Peebles)指出,Sora 将通过 “模拟一切 “来帮助人们探索 AGI。
Sora is here! It's a diffusion transformer that can generate up to a minute of 1080p video with great coherence and quality. @_tim_brooks and I have been working on this at @openai for a year, and we're pumped about pursuing AGI by simulating everything! https://t.co/DzbyReLJEc pic.twitter.com/IFqfh8H6FW
— Bill Peebles (@billpeeb) February 15, 2024
在美国联邦机构再次推动对人工智能进行监管,特别是针对其欺诈和深度伪造真人的可能性之际,Sora 的出现似乎不仅是 OpenAI 的一个里程碑,也是整个科技和媒体行业乃至整个人类的一个里程碑–不过是好是坏,还有待观察。
AI 发展好快啊,去年这个时候 ChatGPT 才刚刚出来,现在就已经有视频 ai 了,以后可能就是 ai 的天下了
@Pampo 是的,如今视频AI出来了,抖音段子手们感觉也要被替代了,更远的未来一部分人进去数字世界,一部分人跟随地球去流浪
This is excellent I like this app it exactly what we need 😌!!
Actually really nice, great group of individuals.
GOOD AND CREATIVE.. CANT WAIT TELL MY HOMIES
Top, really recommend it! i received all the foloowwrs in a matter of minutes and also got some extra one :)