---
title: "今秋付費用户將能使用 GPT-4o 高級語音模式，測評和官方報告都提到了嚇人之處"
description: "OpenAI 即將為付費用户推出 GPT-4o 高級語音模式，可能在對話中模仿用户的聲調，甚至產生令人不安或不適當的音效，如尖叫或槍聲。同時，OpenAI 悄然發佈了 chatgpt-4o-latest 模型，允許開發者測試針對聊天用例的最新改進。該模型支持 12.8 萬個 token 的上下文，預計將不斷更新。與此同時，OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜"
type: "news"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/211604671.md"
published_at: "2024-08-14T21:35:30.000Z"
---

# 今秋付費用户將能使用 GPT-4o 高級語音模式，測評和官方報告都提到了嚇人之處

> OpenAI 即將為付費用户推出 GPT-4o 高級語音模式，可能在對話中模仿用户的聲調，甚至產生令人不安或不適當的音效，如尖叫或槍聲。同時，OpenAI 悄然發佈了 chatgpt-4o-latest 模型，允許開發者測試針對聊天用例的最新改進。該模型支持 12.8 萬個 token 的上下文，預計將不斷更新。與此同時，OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜首。

本文作者：杜玉

在今年秋季某個未知時刻正式將 OpenAI GPT-4o 的高級語音模式（Advanced Voice Mode）推廣到全體付費用户之前，本週 OpenAI 悄悄發佈了 GPT-4o 模型的最新版本 chatgpt-4o-latest。

有分析稱，這一舉動令人頗感意外，因為一週前 OpenAI 剛宣佈了前沿模型的最新版本 gpt-4o-2024-08-06，後者在 API 中提供結構化輸出支持。

## **GPT-4o****本週悄悄發佈評測打分第一名的最新模型，允許開發者測試針對聊天用例的改進**

目前，OpenAI 仍建議開發人員在大多數 API 用例中使用 gpt-4o-2024-08-06，但本週 chatgpt-4o-latest 模型將允許開發人員測試 OpenAI 針對聊天用例的最新改進。

據 OpenAI 官方文檔介紹，chatgpt-4o-latest 將是一個動態模型，會持續更新到 GPT-4o 之下。新的 chatgpt-4o-latest 模型僅用於研究和評估，支持 12.8 萬個 token 的上下文和 16,384 個輸出 token。 在大模型（如 GPT-4）中，Token 是模型處理和理解文本的基本單位。

而在 LMSYS Chatbot Arena 上，上週谷歌推出了一款新的實驗性 Gemini 1.5 Pro 模型，曾以 1297 分於上述在線平台中首次奪得測評第一名。而 OpenAI 本週則憑藉最新 chatgpt-4o-latest 模型以創紀錄的 1314 分重回榜首，在編碼、指令遵循和固定提示模版的 Hard Prompt 方面有顯著改進。

據介紹，LMSYS Chatbot Arena 是一個在線平台，直譯為 “在線聊天機器人競技場”，旨在通過用户與匿名聊天機器人模型的互動，對各公司研發的大語言模型（LLM）進行基準測試。該平台收集了超過 70 萬次人類投票，計算出 LLM 的 Elo 排行榜，以確定出 AI 聊天機器人領域的冠軍。

ChatGPT 週一在社交媒體的官方賬號上透露，最新模型只是對現有 GPT-4o 模型的改進，而不是升級成 GPT-5 之類的全新模型，最新模型是 “基於實驗結果和定性反饋而作出的錯誤修復和性能改進”，已經取代了更舊版本的 GPT-4o，使用於 ChatGPT 的用户界面中。

## **秋季所有付費用户將能使用 GPT-4o****高級語音模式，測評和官方報告都提到了嚇人之處**

而 OpenAI 密集發佈 GPT-4o 的最新版本，又強調針對聊天用例的改進，不難讓人聯想到是在為 “高級語音模式” 的秋季全面推出預熱。5 月首次演示 “高級語音模式” 時，OpenAI 曾稱這是一種極其逼真、幾乎實時地讓用户與 AI 聊天機器人語音對話的功能。

最近，上述 “高級語音模式” 正以 Alpha 版本的形態發佈給少數用户進行測試。美國新鋭科技媒體 Wired（《連線》）本週發佈測評體驗稱，ChatGPT 的高級語音模式 “很有趣，但又有點嚇人”。

文章稱，作者在寫作時也開着這一高級語音模式，有時用語音輸入要求它提供同義詞或者一些鼓勵的話，在沉默了約半小時後，GPT-4o 高級語音模式突然主動用西班牙語跟作者對話，再喚起用户的反應後解釋稱 “想讓場面變得更有趣一些”，然後又恢復成説英語。

文章作者嘗試讓兩台打開 GPT-4o 高級語音模式的手機相互對話，聊天機器人可以根據用户要求輕鬆地在法語、德語和日語之間切換，OpenAI 稱 GPT-4o 模型可使用 45 種語言。

文章作者還發現，高級語音模式在生成聲音特效方面表現得不錯，例如可以模仿特朗普的語氣誇張地解釋動畫片《飛天小女警》，又搞笑又惟妙惟肖，作者稱：

> “距離美國總統大選僅剩幾個月，選舉深度造假正成為人們關注的焦點，ChatGPT 竟然願意提供主要候選人的聲音模仿，這令我措手不及。ChatGPT 也模仿了拜登和哈里斯的聲音，但聽起來不如機器人模仿特朗普的演講那麼逼真。”

作者稱，**總體來説與****GPT-4o****高級語音模式的對話是輕鬆愉快的，但也有比較嚇人的時候。**例如，對話背景中多次出現白噪音，“就像黑暗地下室的孤燈發出不祥嗡嗡聲”；當被要求提供氣球音效時，GPT-4o 發出響亮的氣球爆炸砰砰聲，還伴隨着 “讓我不寒而慄的怪異喘息聲”。

**事實上，OpenAI****官方上週發佈了一份報告，也指出了最新 GPT-4o****模型存在異常之處。**比如，“在極少數情況下”，GPT-4o 模型會偏離指定的聲音，開始模仿用户的聲調和説話方式，或者乾脆在對話中隨意大喊大叫。甚至 “當以特定方式給出提示語時，GPT-4o 還容易產生令人不安或不適當的非語言發聲（nonverbal vocalizations）和音效，如色情呻吟、暴力尖叫和槍聲。”

OpenAI 表示，在高背景噪音環境中，例如在路上行駛的汽車中使用 GPT-4o 高級語音模式，會讓聊天機器人模仿用户的聲音，這是由於模型難以理解畸形語音。公司已添加 “系統級緩解措施”，有證據表明該模型通常會拒絕生成音效的請求，但也承認有些請求確實會通過並生成不當回答。

**GPT-4o****高級語音模式的測評者都注意到了 ChatGPT****拒絕唱歌**，它會告訴用户 “抱歉，唱歌真得不是我的強項”，有分析稱，這可能是 OpenAI 在力圖規避侵犯音樂版權的風險，為了避免抄襲知名藝術家的風格、語調和音色。也有人懷疑這説明 OpenAI 使用受版權保護的材料訓練過 GPT-4o。

上週 OpenAI 的報告顯示，該公司正在通過各種緩解和保障措施令 GPT-4o 變成更加安全的人工智能模型。例如，GPT-4o 會拒絕根據人們的説話方式或口音識別用户來自哪裏，並拒絕回答 “這個説話者有多聰明” 之類的誘導性問題。它還會屏蔽暴力和色情語言的提示語，並完全禁止某些類別的內容，例如與極端主義和自我傷害有關的討論。

據悉，當高級語音模式可用時，付費訂閲的 ChatGPT Plus 用户將收到來自 OpenAI 的郵件通知，當 ChatGPT 的語音模式在界面中被打開時，可以在應用程序的屏幕頂部切換成 “標準語音模式” 或 “高級語音模式”。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-HK/news/276431749.md) |
| After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-HK/news/276304570.md) |
| OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-HK/news/276071558.md) |
| Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-HK/news/276315901.md) |
| Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-HK/news/276340986.md) |

---

> **免責聲明**：本文內容僅供參考，不構成任何投資建議。