OpenAI 首批王炸来了,最贵收费 ChatGPT Pro 无限畅用旗下模型,包括 “最智能的” o1

华尔街见闻
2024.12.05 20:25
portai
我是 PortAI,我可以总结文章信息。

ChatGPT Pro 套餐每月订阅收费 200 美元,包括高级语音模式 Advanced Voice 和 GPT-4o、o1 等模型,以及独有的 o1 版本 o1 pro mode。o1 pro mode 在数学、科学和编码方面的基准测试得分均高于 o1 和 o1 preview,且在可靠性要求更严格的测试下,优势更大。此外,ChatGPT Plus 套餐中纳入了 o1 正式版,每月收费 20 美元,正式版支持多模态输入,错误率比 o1 preview 减少 34%。

本文作者:李丹

来源:硬 AI

OpenAI CEO Sam Altman预告的 “王炸”首批出炉:OpenAI 推出了一款高端的 GPT 订阅套餐 ChatGPT Pro。它的收费在 OpenAI 目前的各产品中最高,提供 OpenAI 旗下所有模型的无限使用权,包括 OpenAI 最强推理模型 o1 及 o1 系列的一个升级版本。

美东时间 12 月 5 日周四,OpenAI 确认了稍早一些网传的消息,正式推出名为 ChatGPT Pro 的套餐,每月订阅收费 200 美元。OpenAI 称,该套餐的订阅用户可以大规模访问 OpenAI 旗下最佳的模型和工具,包括无限制访问 OpenAI 最智能的模型 OpenAI o1 以及同系列较小模型 o1-mini、GPT-4o、类人的 ChatGPT 高级语音模式 Advanced Voice。

此外,ChatGPT Pro 的套餐中还包括名为 o1 pro mode 的新 o1 版本,也是 ChatGPT Pro 独有的 o1 版本。OpenAI 称,这个新版本使用更多的计算,能更深入地思考,并为最困难的问题提供更好的答案。希望未来为 ChatGPT Pro 添加更强大的计算密集型生产力功能。

Altman 在社交媒体发帖介绍,OpenAI 本周四有两个新动作,一是在 ChatGPT Plus 套餐中纳入了 o1,每月收费 20 美元,二是推出每月收费 200 美元的 ChatGPT Pro,它可以让订阅者无限使用模型、甚至是更智能的 o1。

Altman 之前在社交媒体发帖预告,从本周四开始,OpenAI 将进行为期 12 天的 OpenAI 活动,每天都会有一个直播,包括最新技术或产品演示。有网友当时预计,OpenAI 会推出所谓满血 o1,即正式版 o1。本次 Altman 提到的 ChatGPT Plus 新纳入 o1 就是这个正式版本。

正式版 o1 支持多模态输入,具备视觉推理能力。相比 o1 view 版本,正式 o1 的平均响应速度快了 60%,OpenAI 还发现正式版 o1 在推理时犯重大错误的频率比 o1 preview 减少 34%。

o1 pro mode 在数学、科学和编码方面强于 o1 且更可靠

OpenAI 认为,ChatGPT Pro 为研究人员、工程师和其他每天使用研究级智能的个人提供了一种提高他们生产力的新方式,该方式让他们能处于人工智能(AI)进步的前沿。

OpenAI 特别介绍了 o1 pro mode,称 ChatGPT Pro 提供了 OpenAI“最智能模型的一个版本”,“该模型可以思考更长时间,从而获得最可靠的回应。” 在外部专家测试人员的评估中,o1 pro mode 可以产生更可靠、更准确、更全面的回应,尤其是在数据科学、编程和案例法分析等领域。

下图显示,在数学、科学和编码等具有挑战性的机器学习(ML)基准测试中,o1 pro mode 的表现均胜过 o1 和 o1-preview。在数学方面,o1 pro mode 得分 86,o1 和 o1-preview 分别为 78 和 50,在编码方面,o1 pro mode 得分 90,o1 和 o1-preview 分别为 89 和 62,在问答博士级别的科学问题方面,o1 pro mode 得分 79,后两者分别为 76 和 74。

为了突出 o1 pro mode 的主要优势——可靠性更高,OpenAI 还提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题、而不是仅一次答对时,才能算作模型解决了问题。即使在这种高标准要求下,o1 pro mode 的表现也明显强于 o1 和 o1-preview。

下图可见,在以上四次答问都必须正确的标准下,o1 pro mode 相比 o1 和 o1-preview 的优势更大。数学方面,o1 pro mode 得分 80,o1 和 o1-preview 分别为 67 和 37,在编码方面,o1 pro mode 得分 75,o1 和 o1-preview 分别为 64 和 26,在问答博士级别的科学问题方面,o1 pro mode 得分 74,后两者分别为 67 和 58。