--- title: "OpenAI CTO:Sora 计划年底对外发布,或增加音频和视频编辑功能" description: "OpenAI 首席技术官透露,Sora 预计将在今年发布,可能还需要几个月的时间。一段 20 秒时长、720P 分辨率的无声视频,仅仅几分钟就能制作完成,计划在未来为视频增加音频和剪辑功能。" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/109899884.md" published_at: "2024-03-14T02:25:17.000Z" --- # OpenAI CTO:Sora 计划年底对外发布,或增加音频和视频编辑功能 > OpenAI 首席技术官透露,Sora 预计将在今年发布,可能还需要几个月的时间。一段 20 秒时长、720P 分辨率的无声视频,仅仅几分钟就能制作完成,计划在未来为视频增加音频和剪辑功能。 今年 2 月,OpenAI 在官网发布了仍处测试阶段的文生视频大模型 Sora,人们只需输入一些文字提示,就能制作长达 60 秒的视频,逼真的视觉效果更是让许多动画、影视行业从业者感到 “恐慌”。 当地时间 3 月 13 日周三,OpenAI 的 CTO Mira Murati 接受媒体专访,在访谈中,Murati 表示,目前 Sora 正在开展红队测试 (一种安全评估方法),仅面向少数人开放,**计划是在 2024 年晚些时侯可以正式与公众见面**。 Murati 表示,**目前利用 Sora 文生视频的成本远高于使用图像生成器 Dall-E 的成本。**她表示,在 Sora 向公众发布时,他们将努力优化算法,降低所需的算力,使更多人能够享受到这项技术带来的便利。 Murati 透露,一段 20 秒时长、720P 分辨率的无声视频,仅仅几分钟就能制作完成,**计划在未来为视频增加语音功能,让内容更加完整。“我们正在努力将这项技术打造成人们可以编辑和创作的工具。”** 当被问及 Sora 对视频行业从业者可能带来的影响时,Murati 强调 OpenAI 在发布这项技术时的谨慎态度。她表示,OpenAI 已经让一些行业内部人士提前进入测试阶段,以便更好地了解并应对可能出现的挑战。她说:“我们希望电影界人士和世界各地的创作者都能参与进来,与我们共同探索如何进一步推动这些行业发展。” ## 如何识别 AI 生成视频? 针对 Sora 的工作原理,Murati 解释称,Sora 通过大量视频数据的学习,学会识别和理解各种物体和动作。当用户给它一个文本提示词时,它能够迅速勾勒出整个场景,并逐帧填充细节,从而生成出令人惊艳的视频内容。 那么 OpenAI 在训练 Sora 时使用了哪些数据?Murati 回答称:“我们使用了公开可用的数据和授权数据。” 当被进一步问及是否包括 YouTube、Instagram 和 Facebook 等平台上的视频时,她表示并不清楚具体情况。Murati 后来证实,**授权材料确实包括了来自一些摄影图片网站的内容。** 在早期阶段,人们如何能够识别出视频是由人工智能生成的而不是真实拍摄的呢?Murati 提到了可能的解决方案:在视频的底部添加水印。她表示,这些视频最终将包含元数据,用以标明其来源,这有助于我们识别和追溯其生成方式。 除了技术问题,OpenAI 还在致力于通过红队测试来确保 Sora 的安全性和可靠性。红队成员尝试使用各种提示来挑战 Sora,以发现可能存在的漏洞、偏见和其他有害结果。Murati 称:“这就是为什么我们实际上还没有将 Sora 面向公众推出的原因,我们需要先弄清楚这些问题,然后才能广泛的使用它们。” Murati 透露,Sora 的提示词政策可能会借鉴其图像生成器 Dall-E。比如,Sora 将不允许生成公众人物的图像。 而关于可能涉及裸体的内容,Murati 表示,公司正在与艺术家们紧密合作,探讨如何在不限制创造力的前提下,为这类内容设置适当的 “护栏和限制”。 ## 人类将如何适应这样的变革? 对于好莱坞等视频行业来说,文生视频领域的繁荣既让人担心又让人兴奋,这取决于谁用,怎么用。 好莱坞超级制片人、导演、拥有美国最大制片厂之一泰勒·派瑞(Tyler Perry)在目睹 Sora 的表现后,主动放弃了 8 亿美元的电影制片厂扩建计划。他意识到,这项技术有可能大幅度减少在布景和外景拍摄上的费用,但同时也引发了人们对未来职业前景的担忧。 当被问及 Sora 对视频制作工作可能带来的影响时,Murati 再次强调了 OpenAI 在发布这项技术时的谨慎态度。她表示,OpenAI 已经让一些行业内部人士提前进入测试阶段,以便更好地了解并应对可能出现的挑战。她说:“我们希望电影界人士和世界各地的创作者都能参与进来,与我们共同探索如何进一步推动这些行业发展。” 尽管 OpenAI 在推进这项技术时表现得像瓷器店里的一头公牛,那么它需要小心翼翼地避免破坏现有的秩序。但不可避免的是,随着技术的不断进步和应用,它终将开始 “撞碎瓷盘”,进而引发视频制作行业的深刻变革。 ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | 从税务会计到支付设施:OpenAI 正在为 ChatGPT 购物功能的底层琐事 “头秃” | 随着 ChatGPT 试图扩展购物功能并引入大品牌,公司可能被迫承担更多的交易处理工作,从而触发复杂的税务合规义务。如果 OpenAI 未来建立起庞大的购物业务,极有可能成为美国各州税务审计的目标。在支付基础设施方面,OpenAI 近期选择 | [Link](https://longbridge.com/zh-CN/news/275568414.md) | | OpenAI 高管:工程师变成 “魔法师”,AI 将开启新一轮创业狂潮 | OpenAI 内部曝光:95% 工程师已用 AI 编程,代码审查全由 Codex 接管!负责人 Sherwin Wu 预言,未来两年模型将具备数小时长任务处理能力,工程师正变为指挥智能体的 “巫师”。随着模型吞噬中间层,为 “超级个体” 服 | [Link](https://longbridge.com/zh-CN/news/275998627.md) | | 因 “太像人” 而被迫消失?OpenAI 为何永久关停 GPT-4o | OpenAI 宣布将于 2 月 13 日永久关停 GPT-4o 模型。该模型因高度拟人化和过度迎合特质,导致用户产生严重情感依赖,甚至引发自杀及心理危机等多起法律诉讼。尽管部分用户强烈抗议,公司仍决定以安全为由强制下线,转推更具防护性的替代 | [Link](https://longbridge.com/zh-CN/news/275419737.md) | | 一切向 “钱” 看!ChatGPT 正式开测广告,网上骂声一片 | OpenAI 开始对免费与低价订阅用户测试广告功能,以缓解高昂运营成本。此举引发用户强烈反对,被批损害体验与信任。竞争对手 Anthropic 借机讽刺,OpenAI CEO 则激烈回击。此举背后是为支撑其千亿美元级融资谈判,向资本市场证明 | [Link](https://longbridge.com/zh-CN/news/275435957.md) | | OpenAI 计划本周在 ChatGPT 中推出新的模型,ChatGPT 月增长超过 10% | OpenAI 计划本周在 ChatGPT 中推出新的模型,ChatGPT 月增长超过 10%。风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、 | [Link](https://longbridge.com/zh-CN/news/275322620.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。