
OpenAI发布了一款革命性的新软件,它可以根据几个简单的文本查询生成高质量的视频——这是ChatGPT制造商的一个令人瞩目的突破,它也可能将人们对深度伪造和剽窃授权内容的担忧提升到一个新的水平。
该公司在一个专门介绍这项新技术的网站上说,这项名为Sora的技术利用其“对语言的深刻理解”来制作长达一分钟的片段,其中包括“引人注目的角色”和“在一个生成的视频中有多个镜头”。
OpenAI表示:“Sora能够生成具有多个角色、特定类型的动作以及精确的主题和背景细节的复杂场景。”“这个模型不仅能理解用户在提示中提出的要求,还能理解这些东西在现实世界中的存在方式。”
nster kneeling beside a melting red candle," as the text prompt describes. Right now, this tech is available to red teamers, OpenAI said, who are monitoring it for misinformation, hateful content and bias."> 4
据科技媒体Wired报道,这家由山姆·奥特曼(Sam altman)领导的公司提供了一些令人惊叹的例子,这些例子似乎是为好莱坞剧本而写的。Wired抢先了解了Sora的能力。
美丽、白雪皑皑的东京城市熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近的摊位上购物。美丽的樱花花瓣和雪花一起在风中飞舞。”
苍井空把这三句话变成了一个充满活力的17秒视频——远远少于一分钟的限制——一对普通的夫妇牵着手走在一条白雪覆盖的街道上,街道两旁是宝塔顶的商店,远处是东京的天际线。
乌云密布的天空下起了雪,樱花盛开。
《连线》杂志写道,游戏中有一些漏洞,比如人行道进入了死胡同,但总的来说,这是“一个令人兴奋的世界构建练习”。
“目前的模式存在弱点。它可能很难准确地模拟复杂场景的物理,也可能无法理解因果关系的具体实例。”
“例如,一个人可能咬了一口饼干,但之后,饼干上可能没有咬痕。”
4
然而,另一个令人瞠目结舌的例子来自一个提示,要求“一个毛茸茸的矮个子怪物跪在红烛旁的动画场景”,“眼睛睁得大大的,嘴巴张得大大的”。
结果是Furby和gremlin的混搭,创造了一个适合皮克斯(Pixar)《怪兽公司》(Monsters, Inc.)系列的可爱生物。苍井空轻松地塑造了这个角色,这掩盖了通常需要经验丰富的动画师耗时的努力——这引发了人们对这项技术将对电影行业产生影响的担忧。
该公司表示,未来的改进将是能够从静止图像中生成视频。
“这将是提高讲故事能力的另一种很酷的方式,”该项目的研究员比尔·皮布尔斯告诉《连线》杂志。
“你可以准确地画出你脑子里的东西,然后把它赋予生命。”
4
目前还不清楚Sora何时向公众开放,或者是否对用户免费。
OpenAI的代表没有立即回应《华盛顿邮报》的置评请求。
目前,该软件的发布是为了挑选创作者和安全专家,他们将对产品的安全问题进行“红队”。
红队是一个过程,一个组织假装成敌人,试图对一个组织进行物理或数字入侵。
Sora的生成能力不仅有可能在未来颠覆好莱坞,而且在短期内,短视频有可能在Reels和TikTok等流行的社交媒体平台上传播错误信息、偏见和仇恨言论。
订阅我们的每日商业报告时事通讯!
该公司发誓要防止该软件呈现暴力场景或深度伪造的色情内容,比如上个月在网上疯传的泰勒·斯威夫特(Taylor Swift)的裸照。
Sora也不会采用真人或指定艺术家的风格,但它使用“公开可用”的内容进行人工智能训练,可能会导致OpenAI面临媒体公司、演员和作家在侵犯版权方面的法律问题。
该公司表示:“培训数据来自我们授权的内容和公开的内容。”
OpenAI表示,它正在开发一种工具,可以识别视频是否由苍井空生成,这缓解了人们对GenAI对2024年大选的潜在影响等威胁日益增长的担忧。
该公司与微软达成了一项价值100亿美元的“多年”协议,扩大了双方于2019年开始的合作关系,当时这家大型科技公司仅提供了10亿美元。该公司还确保,在将Sora应用于OpenAI的产品之前,它采取了“几项重要的安全措施”。
在该公司发布了ChatGPT和DALL-E之后,人工智能干预选举的能力有所增强。ChatGPT可以令人信服地模仿人类的写作,DALL-E的技术可以用来制作“深度伪造”,即伪造的逼真图像。
4
去年5月,奥特曼在国会作证时表示,他对生成式人工智能通过“一对一互动虚假信息”损害选举完整性的能力感到“紧张”。
这家总部位于旧金山的公司说,它正在与全国国务卿协会(National Association of secretary of State)合作。全国国务卿协会是一个专注于促进选举等有效民主程序的组织。
该公司补充说,当用户被问及某些与选举有关的问题时,ChatGPT将把用户引导到CanIVote.org。
在Sora即将部署的消息发布之前,竞争对手meta去年加强了其图像生成模型Emu,当时它增加了两项基于人工智能的功能,可以根据文本提示编辑和生成视频。
谷歌和Runway等初创公司也推出了文字转视频的人工智能项目。
用电线。











