--- title: "今秋付費用户將能使用 GPT-4o 高級語音模式,測評和官方報告都提到了嚇人之處" description: "OpenAI 即將為付費用户推出 GPT-4o 高級語音模式,可能在對話中模仿用户的聲調,甚至產生令人不安或不適當的音效,如尖叫或槍聲。同時,OpenAI 悄然發佈了 chatgpt-4o-latest 模型,允許開發者測試針對聊天用例的最新改進。該模型支持 12.8 萬個 token 的上下文,預計將不斷更新。與此同時,OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜" type: "news" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/211604671.md" published_at: "2024-08-14T21:35:30.000Z" --- # 今秋付費用户將能使用 GPT-4o 高級語音模式,測評和官方報告都提到了嚇人之處 > OpenAI 即將為付費用户推出 GPT-4o 高級語音模式,可能在對話中模仿用户的聲調,甚至產生令人不安或不適當的音效,如尖叫或槍聲。同時,OpenAI 悄然發佈了 chatgpt-4o-latest 模型,允許開發者測試針對聊天用例的最新改進。該模型支持 12.8 萬個 token 的上下文,預計將不斷更新。與此同時,OpenAI 也在 LMSYS Chatbot Arena 上以新模型重回榜首。 本文作者:杜玉 在今年秋季某個未知時刻正式將 OpenAI GPT-4o 的高級語音模式(Advanced Voice Mode)推廣到全體付費用户之前,本週 OpenAI 悄悄發佈了 GPT-4o 模型的最新版本 chatgpt-4o-latest。 有分析稱,這一舉動令人頗感意外,因為一週前 OpenAI 剛宣佈了前沿模型的最新版本 gpt-4o-2024-08-06,後者在 API 中提供結構化輸出支持。 ## **GPT-4o****本週悄悄發佈評測打分第一名的最新模型,允許開發者測試針對聊天用例的改進** 目前,OpenAI 仍建議開發人員在大多數 API 用例中使用 gpt-4o-2024-08-06,但本週 chatgpt-4o-latest 模型將允許開發人員測試 OpenAI 針對聊天用例的最新改進。 據 OpenAI 官方文檔介紹,chatgpt-4o-latest 將是一個動態模型,會持續更新到 GPT-4o 之下。新的 chatgpt-4o-latest 模型僅用於研究和評估,支持 12.8 萬個 token 的上下文和 16,384 個輸出 token。 在大模型(如 GPT-4)中,Token 是模型處理和理解文本的基本單位。 而在 LMSYS Chatbot Arena 上,上週谷歌推出了一款新的實驗性 Gemini 1.5 Pro 模型,曾以 1297 分於上述在線平台中首次奪得測評第一名。而 OpenAI 本週則憑藉最新 chatgpt-4o-latest 模型以創紀錄的 1314 分重回榜首,在編碼、指令遵循和固定提示模版的 Hard Prompt 方面有顯著改進。 據介紹,LMSYS Chatbot Arena 是一個在線平台,直譯為 “在線聊天機器人競技場”,旨在通過用户與匿名聊天機器人模型的互動,對各公司研發的大語言模型(LLM)進行基準測試。該平台收集了超過 70 萬次人類投票,計算出 LLM 的 Elo 排行榜,以確定出 AI 聊天機器人領域的冠軍。 ChatGPT 週一在社交媒體的官方賬號上透露,最新模型只是對現有 GPT-4o 模型的改進,而不是升級成 GPT-5 之類的全新模型,最新模型是 “基於實驗結果和定性反饋而作出的錯誤修復和性能改進”,已經取代了更舊版本的 GPT-4o,使用於 ChatGPT 的用户界面中。 ## **秋季所有付費用户將能使用 GPT-4o****高級語音模式,測評和官方報告都提到了嚇人之處** 而 OpenAI 密集發佈 GPT-4o 的最新版本,又強調針對聊天用例的改進,不難讓人聯想到是在為 “高級語音模式” 的秋季全面推出預熱。5 月首次演示 “高級語音模式” 時,OpenAI 曾稱這是一種極其逼真、幾乎實時地讓用户與 AI 聊天機器人語音對話的功能。 最近,上述 “高級語音模式” 正以 Alpha 版本的形態發佈給少數用户進行測試。美國新鋭科技媒體 Wired(《連線》)本週發佈測評體驗稱,ChatGPT 的高級語音模式 “很有趣,但又有點嚇人”。 文章稱,作者在寫作時也開着這一高級語音模式,有時用語音輸入要求它提供同義詞或者一些鼓勵的話,在沉默了約半小時後,GPT-4o 高級語音模式突然主動用西班牙語跟作者對話,再喚起用户的反應後解釋稱 “想讓場面變得更有趣一些”,然後又恢復成説英語。 文章作者嘗試讓兩台打開 GPT-4o 高級語音模式的手機相互對話,聊天機器人可以根據用户要求輕鬆地在法語、德語和日語之間切換,OpenAI 稱 GPT-4o 模型可使用 45 種語言。 文章作者還發現,高級語音模式在生成聲音特效方面表現得不錯,例如可以模仿特朗普的語氣誇張地解釋動畫片《飛天小女警》,又搞笑又惟妙惟肖,作者稱: > “距離美國總統大選僅剩幾個月,選舉深度造假正成為人們關注的焦點,ChatGPT 竟然願意提供主要候選人的聲音模仿,這令我措手不及。ChatGPT 也模仿了拜登和哈里斯的聲音,但聽起來不如機器人模仿特朗普的演講那麼逼真。” 作者稱,**總體來説與****GPT-4o****高級語音模式的對話是輕鬆愉快的,但也有比較嚇人的時候。**例如,對話背景中多次出現白噪音,“就像黑暗地下室的孤燈發出不祥嗡嗡聲”;當被要求提供氣球音效時,GPT-4o 發出響亮的氣球爆炸砰砰聲,還伴隨着 “讓我不寒而慄的怪異喘息聲”。 **事實上,OpenAI****官方上週發佈了一份報告,也指出了最新 GPT-4o****模型存在異常之處。**比如,“在極少數情況下”,GPT-4o 模型會偏離指定的聲音,開始模仿用户的聲調和説話方式,或者乾脆在對話中隨意大喊大叫。甚至 “當以特定方式給出提示語時,GPT-4o 還容易產生令人不安或不適當的非語言發聲(nonverbal vocalizations)和音效,如色情呻吟、暴力尖叫和槍聲。” OpenAI 表示,在高背景噪音環境中,例如在路上行駛的汽車中使用 GPT-4o 高級語音模式,會讓聊天機器人模仿用户的聲音,這是由於模型難以理解畸形語音。公司已添加 “系統級緩解措施”,有證據表明該模型通常會拒絕生成音效的請求,但也承認有些請求確實會通過並生成不當回答。 **GPT-4o****高級語音模式的測評者都注意到了 ChatGPT****拒絕唱歌**,它會告訴用户 “抱歉,唱歌真得不是我的強項”,有分析稱,這可能是 OpenAI 在力圖規避侵犯音樂版權的風險,為了避免抄襲知名藝術家的風格、語調和音色。也有人懷疑這説明 OpenAI 使用受版權保護的材料訓練過 GPT-4o。 上週 OpenAI 的報告顯示,該公司正在通過各種緩解和保障措施令 GPT-4o 變成更加安全的人工智能模型。例如,GPT-4o 會拒絕根據人們的説話方式或口音識別用户來自哪裏,並拒絕回答 “這個説話者有多聰明” 之類的誘導性問題。它還會屏蔽暴力和色情語言的提示語,並完全禁止某些類別的內容,例如與極端主義和自我傷害有關的討論。 據悉,當高級語音模式可用時,付費訂閲的 ChatGPT Plus 用户將收到來自 OpenAI 的郵件通知,當 ChatGPT 的語音模式在界面中被打開時,可以在應用程序的屏幕頂部切換成 “標準語音模式” 或 “高級語音模式”。 ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-HK/news/276431749.md) | | After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-HK/news/276304570.md) | | OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-HK/news/276071558.md) | | Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-HK/news/276315901.md) | | Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-HK/news/276340986.md) | --- > **免責聲明**:本文內容僅供參考,不構成任何投資建議。