GPT 4o 意味着什么?OpenAI 加苹果,AI 手机势不可挡!

华尔街见闻
2024.05.14 01:04
portai
我是 PortAI,我可以总结文章信息。

英伟达高级研究科学家 Jim Fan:这可能会成为从一开始就拥有 10 亿用户的 AI 产品,OpenAI 之于苹果类似于 “用于智能手机的 FSD”。

本文作者:李笑寅

来源:硬 AI

ChatGPT 带飞 Siri?

当地时间 5 月 13 日上午 10 点,OpenAI 在春季发布会上发布了 GPT-4 的迭代版本——GPT-4o。据悉,GPT-4o 的速度是上一代的两倍,并且对用户更友好:语音唤起、实时对话、无需注册、免费使用。

OpenAI 表示,GPT-4o 及其文本和图像能力即日起将开始向 API 和用户推出,语音和视频能力即将推出。

从定位来看,全新的旗舰版本 GPT-4o 似乎正在挑战 Siri。

实则不然。就在此前,有媒体报道透露,苹果已经与 OpenAI 达成协议,将在全新操作系统 iOS 18 中引入 ChatGPT 技术,以升级 Siri 的对话体验。

这不由令人猜想,GPT-4o 和 Siri 将如何结合?ChatGPT 和苹果又将如何定义新一代 AI 手机?

GPT-4o 升级在哪?

1)融媒能力:GPT-4o 同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答。

2)速度更快:GPT-4o 的速度是上一代的 5 倍,语音延迟大幅改善,可以在 232 毫秒内回应音频输入,平均为 320 毫秒,接近人类对话的反应时间。这意味用户可以和 GPT-4o 实时对话、甚至直接打视频让 Ta 在线解答各种问题。

3)免费开放:尽管 “价格战” 的风还是吹到了 AI 界,但 OpenAI 显然不买账——发布会即日起,GPT-4o 将面向 ChatGPT 的所有付费和免费用户发布,取消其他所有限制,API 价格降价 50%。

正如发布会所说,GPT-4o 中的 “o” 代表 “omni”,意为全能,从目前的功能更新来看,得到全栈优化的全新 GPT-4o 真正成为了一款 AI 实时语音助手,性能远超 Siri。

演示中,GPT-4o 还展现出宣传点之外的小功能,但惊喜程度不亚于前者:能够实时翻译、识别表情,可以通过摄像头识别画面写代码分析图表。

“苹果 +OpenAI” 将如何定义 AI 手机?

因下一代 iPhone 操作系统计划发布基于 LLM(大型语言模型)的新功能,苹果正就此寻找第三方合作伙伴,谈判对象包括谷歌、OpenAI。

就目前看来,苹果和 OpenAI 的适配度似乎更高。

有分析指出,苹果和 OpenAI 的合作能够解决彼此在发展边缘 AI 方面的痛点,真正做到各取所需——

OpenAI 最需要什么?端侧应用权限、系统级权限,只有苹果能提供。

苹果最需要什么?最好的 AI 技术,最适配的大语言模型,GPT-4o 无疑是最佳人选。

况且,苹果在自研芯片、封闭生态系统上还具有独特优势。正如英伟达高级研究科学家 Jim Fan 在 X 平台的评论:谁先赢得苹果,谁就赢得了胜利。

我认为与 iOS 的集成将出现 3 个层级:

1)放弃 Siri。OpenAI 为 iOS 提炼出更小型、纯设备上的 GPT-4o,并可选择付费升级以使用云。

2) 将相机或屏幕传输到模型中的本机功能。对神经音频/视频编解码器的芯片级支持。

3)集成 iOS 系统操作 API 和智能家居 API。Siri 快捷方式是时候复活了。

这可能会成为从一开始就拥有 10 亿用户的 AI 产品,OpenAI 之于苹果类似于 “用于智能手机的 FSD”。

进一步展望,ChatGPT 引入 iPhone 能创造怎样的新增长故事?

Wedbush 分析师 Dan Ives 在周一的一份报告表示:

在 iPhone 16 中嵌入 OpenAI 聊天框也将开辟新的增长途径,这将让重要的开发者以及微软开发者生态系统一起涌入苹果生态系统。”

“从本质上讲,与 OpenAI 建立紧密的合作关系将改变游戏规则,而对于微软/OpenAI 来说,与全球最大的电子消费品牌捆绑将是一个明智的选择。”

Ives 预计,苹果将在 6 月 10 日的 WWDC 大会上官宣和 OpenAI 的合作伙伴关系,并推出基于苹果 LLM 的 AI 聊天机器人。