--- title: "OpenAI 推出新音频模型,瞄准客户服务领域" description: "OpenAI 推出了新的音频模型,旨在通过语音代理增强客户服务。这些模型包括语音转文本和文本转语音功能,专为企业使用而设计,允许开发者自定义语音语调。分析师指出,这些创新可能减少对人工代理的需求,并改善客户互动中的自动化。然而,OpenAI 面临来自专业 AI 供应商和现有呼叫中心解决方案的竞争。在处理特定语音细微差别(如缩略词)以及在有效利用这些 API 时需要进行业务整合方面,仍然存在挑战" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/233026731.md" published_at: "2025-03-24T23:52:27.000Z" --- # OpenAI 推出新音频模型,瞄准客户服务领域 > OpenAI 推出了新的音频模型,旨在通过语音代理增强客户服务。这些模型包括语音转文本和文本转语音功能,专为企业使用而设计,允许开发者自定义语音语调。分析师指出,这些创新可能减少对人工代理的需求,并改善客户互动中的自动化。然而,OpenAI 面临来自专业 AI 供应商和现有呼叫中心解决方案的竞争。在处理特定语音细微差别(如缩略词)以及在有效利用这些 API 时需要进行业务整合方面,仍然存在挑战 OpenAI 推出了一套新的音频模型,支持特定企业环境中的语音代理,例如客户服务。 这些模型包括 OpenAI 的实时 API 中的 语音转文本 和文本转语音音频模型。 该人工智能供应商还推出了 gpt-4o-transcribe 和 gpt-4o-mini-transcribe。OpenAI 表示,gpt-4o-transcribe 在词错误率表现上优于 OpenAI 的开源语音转文本模型。 这些新模型捕捉了语音的细微差别,减少了误识别,并提高了转录的真实感。 OpenAI 还推出了 gpt-4o-mini TTS,这是一种文本转语音模型,允许开发者 “指示” 模型说什么以及如何说。 这些模型基于 GPT-4o 和 GPT-4o-mini 架构。 ## 语调和受众 根据 OpenAI 的说法,开发者可以指示模型以特定方式发声。例如,用户可以告诉模型像 “同情的客户服务代理” 那样说话。 Gartner 分析师 Arun Chandrasekaran 表示,这些新的音频模型针对 OpenAI 的消费者受众和一小部分企业市场。 许多消费者使用 ChatGPT,因此这些受众会对音频 API 中引入的一些语调感兴趣,例如中世纪骑士、真实犯罪爱好者和睡前故事。 与此同时,像专业和冷静这样的语调将在处理愤怒客户的客户服务环境中非常有用,Chandrasekaran 表示。 他说:“客户服务是我们开始看到的增长最快的企业用例之一,我并不感到惊讶的是所有这些公司都在努力朝着有利可图的方向发展。” Forrester Research 分析师 William McKeon-White 表示,这些新模型将减少处理每次互动所需的人类代理数量,并允许更多自动化的 互动语音响应系统。 他说:“我们实际上已经看到这些模型上线,与其他二级消费者合作,这些消费者本身就是供应商。他们已经在这些能力上取得了强劲的成功。” McKeon-White 表示,用户应该能够从 OpenAI 的语音模型中受益,因为该供应商提供的自动化和交付水平。 他说:“OpenAI 现在提供的这一点对许多看到不同模型的企业来说是相当有帮助的。” OpenAI 对新模型错误率的分析显示,这些模型在法语和西班牙语等广泛使用的语言中有效。 ## 一些挑战 然而,McKeon-White 表示,看看这些模型如何处理缩略词将是很好的,因为语音模型在处理缩略词时会遇到挑战。 此外,由于客户服务应用的竞争激烈,OpenAI 面临一些挑战。 其中之一是该供应商与从狭义角度看待客户服务的供应商竞争。例如,Sierra AI 是一家专注于客户服务的人工智能初创公司。 Chandrasekaran 表示,这与 OpenAI 不同,后者有多个模型和多个应用。 另一个挑战是许多 联络中心供应商,如 Genesys 已经将人工智能技术嵌入到他们的产品中。 Chandrasekaran 继续说道:“他们都开始将人工智能嵌入其中,当然也与 OpenAI 的做法形成竞争。” 此外,虽然 API 对希望构建应用程序的团队很有帮助,但对没有团队的人则没有益处,McKeon-White 表示。 他说:“我们与大多数组织交谈时,他们并不准备直接消费原始 API 来构建全新的系统。它需要业务逻辑,需要业务理解,还需要业务集成才能使一切正常运作。” *Esther Shittu 是 Informa TechTarget 的新闻撰稿人和播客主持人,专注于人工智能软件和系统。* ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | OpenAI 高管:工程师变成 “魔法师”,AI 将开启新一轮创业狂潮 | OpenAI 内部曝光:95% 工程师已用 AI 编程,代码审查全由 Codex 接管!负责人 Sherwin Wu 预言,未来两年模型将具备数小时长任务处理能力,工程师正变为指挥智能体的 “巫师”。随着模型吞噬中间层,为 “超级个体” 服 | [Link](https://longbridge.com/zh-CN/news/275998627.md) | | 印度顶级电信公司通过 1100 亿美元的建设计划和已验证的快速市场主导策略来应对人工智能 | 印度最大的电信公司,信实 Jio,计划在七年内投资 1100 亿美元用于人工智能基础设施,以提升其服务,利用其市场主导地位。Jio 目前拥有 5.14 亿用户,占印度移动市场的 51%,旨在降低人工智能成本,类似于其在移动数据定价方面的转变 | [Link](https://longbridge.com/zh-CN/news/276406785.md) | | Amigos For Kids 被选为以人为本 AI 基金的 OpenAI Ready 奖项的获得者 | Amigos For Kids 被选为 OpenAI Ready Award 的获奖者,该奖项通过以人为本的人工智能基金支持社区基础解决方案的非营利组织。这一认可恰逢该组织即将迎来其 35 周年纪念。资金将帮助扩展课后和暑期项目,整合人工智 | [Link](https://longbridge.com/zh-CN/news/276142228.md) | | 超过 20,000 人签署请愿书,呼吁 OpenAI 重新启用 GPT-4o | 超过 20,000 人签署请愿书,要求 OpenAI 复活 GPT-4o | [Link](https://longbridge.com/zh-CN/news/276155147.md) | | Bartronics India 否认与 OpenAI 的合作 | 巴特罗尼克斯印度有限公司:公司否认推出 500 兆瓦数据中心,公司否认与 OpenAI 合作 | [Link](https://longbridge.com/zh-CN/news/276327596.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。