---
title: "今秋付费用户将能使用 GPT-4o 高级语音模式，测评和官方报告都提到了吓人之处"
description: "OpenAI 即将为付费用户推出 GPT-4o 高级语音模式，可能在对话中模仿用户的声调，甚至产生令人不安或不适当的音效，如尖叫或枪声。同时，OpenAI 悄然发布了 chatgpt-4o-latest 模型，允许开发者测试针对聊天用例的最新改进。该模型支持 12.8 万个 token 的上下文，预计将不断更新。与此同时，OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜"
type: "news"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/211604671.md"
published_at: "2024-08-14T21:35:30.000Z"
---

# 今秋付费用户将能使用 GPT-4o 高级语音模式，测评和官方报告都提到了吓人之处

> OpenAI 即将为付费用户推出 GPT-4o 高级语音模式，可能在对话中模仿用户的声调，甚至产生令人不安或不适当的音效，如尖叫或枪声。同时，OpenAI 悄然发布了 chatgpt-4o-latest 模型，允许开发者测试针对聊天用例的最新改进。该模型支持 12.8 万个 token 的上下文，预计将不断更新。与此同时，OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜首。

本文作者：杜玉

在今年秋季某个未知时刻正式将 OpenAI GPT-4o 的高级语音模式（Advanced Voice Mode）推广到全体付费用户之前，本周 OpenAI 悄悄发布了 GPT-4o 模型的最新版本 chatgpt-4o-latest。

有分析称，这一举动令人颇感意外，因为一周前 OpenAI 刚宣布了前沿模型的最新版本 gpt-4o-2024-08-06，后者在 API 中提供结构化输出支持。

## **GPT-4o****本周悄悄发布评测打分第一名的最新模型，允许开发者测试针对聊天用例的改进**

目前，OpenAI 仍建议开发人员在大多数 API 用例中使用 gpt-4o-2024-08-06，但本周 chatgpt-4o-latest 模型将允许开发人员测试 OpenAI 针对聊天用例的最新改进。

据 OpenAI 官方文档介绍，chatgpt-4o-latest 将是一个动态模型，会持续更新到 GPT-4o 之下。新的 chatgpt-4o-latest 模型仅用于研究和评估，支持 12.8 万个 token 的上下文和 16,384 个输出 token。 在大模型（如 GPT-4）中，Token 是模型处理和理解文本的基本单位。

而在 LMSYS Chatbot Arena 上，上周谷歌推出了一款新的实验性 Gemini 1.5 Pro 模型，曾以 1297 分于上述在线平台中首次夺得测评第一名。而 OpenAI 本周则凭借最新 chatgpt-4o-latest 模型以创纪录的 1314 分重回榜首，在编码、指令遵循和固定提示模版的 Hard Prompt 方面有显著改进。

据介绍，LMSYS Chatbot Arena 是一个在线平台，直译为 “在线聊天机器人竞技场”，旨在通过用户与匿名聊天机器人模型的互动，对各公司研发的大语言模型（LLM）进行基准测试。该平台收集了超过 70 万次人类投票，计算出 LLM 的 Elo 排行榜，以确定出 AI 聊天机器人领域的冠军。

ChatGPT 周一在社交媒体的官方账号上透露，最新模型只是对现有 GPT-4o 模型的改进，而不是升级成 GPT-5 之类的全新模型，最新模型是 “基于实验结果和定性反馈而作出的错误修复和性能改进”，已经取代了更旧版本的 GPT-4o，使用于 ChatGPT 的用户界面中。

## **秋季所有付费用户将能使用 GPT-4o****高级语音模式，测评和官方报告都提到了吓人之处**

而 OpenAI 密集发布 GPT-4o 的最新版本，又强调针对聊天用例的改进，不难让人联想到是在为 “高级语音模式” 的秋季全面推出预热。5 月首次演示 “高级语音模式” 时，OpenAI 曾称这是一种极其逼真、几乎实时地让用户与 AI 聊天机器人语音对话的功能。

最近，上述 “高级语音模式” 正以 Alpha 版本的形态发布给少数用户进行测试。美国新锐科技媒体 Wired（《连线》）本周发布测评体验称，ChatGPT 的高级语音模式 “很有趣，但又有点吓人”。

文章称，作者在写作时也开着这一高级语音模式，有时用语音输入要求它提供同义词或者一些鼓励的话，在沉默了约半小时后，GPT-4o 高级语音模式突然主动用西班牙语跟作者对话，再唤起用户的反应后解释称 “想让场面变得更有趣一些”，然后又恢复成说英语。

文章作者尝试让两台打开 GPT-4o 高级语音模式的手机相互对话，聊天机器人可以根据用户要求轻松地在法语、德语和日语之间切换，OpenAI 称 GPT-4o 模型可使用 45 种语言。

文章作者还发现，高级语音模式在生成声音特效方面表现得不错，例如可以模仿特朗普的语气夸张地解释动画片《飞天小女警》，又搞笑又惟妙惟肖，作者称：

> “距离美国总统大选仅剩几个月，选举深度造假正成为人们关注的焦点，ChatGPT 竟然愿意提供主要候选人的声音模仿，这令我措手不及。ChatGPT 也模仿了拜登和哈里斯的声音，但听起来不如机器人模仿特朗普的演讲那么逼真。”

作者称，**总体来说与****GPT-4o****高级语音模式的对话是轻松愉快的，但也有比较吓人的时候。**例如，对话背景中多次出现白噪音，“就像黑暗地下室的孤灯发出不祥嗡嗡声”；当被要求提供气球音效时，GPT-4o 发出响亮的气球爆炸砰砰声，还伴随着 “让我不寒而栗的怪异喘息声”。

**事实上，OpenAI****官方上周发布了一份报告，也指出了最新 GPT-4o****模型存在异常之处。**比如，“在极少数情况下”，GPT-4o 模型会偏离指定的声音，开始模仿用户的声调和说话方式，或者干脆在对话中随意大喊大叫。甚至 “当以特定方式给出提示语时，GPT-4o 还容易产生令人不安或不适当的非语言发声（nonverbal vocalizations）和音效，如色情呻吟、暴力尖叫和枪声。”

OpenAI 表示，在高背景噪音环境中，例如在路上行驶的汽车中使用 GPT-4o 高级语音模式，会让聊天机器人模仿用户的声音，这是由于模型难以理解畸形语音。公司已添加 “系统级缓解措施”，有证据表明该模型通常会拒绝生成音效的请求，但也承认有些请求确实会通过并生成不当回答。

**GPT-4o****高级语音模式的测评者都注意到了 ChatGPT****拒绝唱歌**，它会告诉用户 “抱歉，唱歌真得不是我的强项”，有分析称，这可能是 OpenAI 在力图规避侵犯音乐版权的风险，为了避免抄袭知名艺术家的风格、语调和音色。也有人怀疑这说明 OpenAI 使用受版权保护的材料训练过 GPT-4o。

上周 OpenAI 的报告显示，该公司正在通过各种缓解和保障措施令 GPT-4o 变成更加安全的人工智能模型。例如，GPT-4o 会拒绝根据人们的说话方式或口音识别用户来自哪里，并拒绝回答 “这个说话者有多聪明” 之类的诱导性问题。它还会屏蔽暴力和色情语言的提示语，并完全禁止某些类别的内容，例如与极端主义和自我伤害有关的讨论。

据悉，当高级语音模式可用时，付费订阅的 ChatGPT Plus 用户将收到来自 OpenAI 的邮件通知，当 ChatGPT 的语音模式在界面中被打开时，可以在应用程序的屏幕顶部切换成 “标准语音模式” 或 “高级语音模式”。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-CN/news/276431749.md) |
| After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-CN/news/276304570.md) |
| OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-CN/news/276071558.md) |
| Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-CN/news/276315901.md) |
| Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-CN/news/276340986.md) |

---

> **免责声明**：本文内容仅供参考，不构成任何投资建议。