--- title: "阿里巴巴的 AI 语音模型击败了 OpenAI 和 xAI,成功弥合了中国方言之间的差距" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/288128873.md" description: "阿里巴巴的通义实验室开发了 Fun-Realtime-TTS-Preview AI 语音模型,该模型在人工分析语音竞技场排行榜上排名全球第五,超越了 OpenAI 和 xAI 等西方竞争对手。它是前五名中唯一一个中国研发的系统,在捕捉复杂的中文方言和口音方面表现出色。此外,阿里巴巴的自动语音识别(ASR)模型以 1.8% 的词错误率排名第一。这一突破解决了区域中文语音的准确性瓶颈,支持超过 30 种语言和多种方言,同时为金融和医疗等行业提供企业定制服务" datetime: "2026-05-30T02:04:33.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/288128873.md) - [en](https://longbridge.com/en/news/288128873.md) - [zh-HK](https://longbridge.com/zh-HK/news/288128873.md) --- # 阿里巴巴的 AI 语音模型击败了 OpenAI 和 xAI,成功弥合了中国方言之间的差距 阿里巴巴集团推出的一款新型人工智能语音模型在一个重要的全球基准测试中超越了西方竞争对手 OpenAI 和 xAI,凸显了其在捕捉复杂中文方言和口音方面的技术优势。由阿里巴巴的通义实验室开发的 Fun-Realtime-TTS-Preview 在人工分析语音竞技场排行榜上获得了第五名,得分为 1190。这是全球前五名中唯一一个中国研发的语音系统。阿里巴巴拥有《南华早报》。语音竞技场基准测试由人工分析公司运营,该公司位于旧金山,得到了包括前 GitHub 首席执行官 Nat Friedman 和 Google Brain 创始人 Andrew Ng 在内的投资者的支持。该平台通过盲测用户对生成语音片段的评估,使用基于 Elo 的系统对模型进行排名。语音竞技场的用户测试模型在三个核心能力上的表现——将语音转换为文本、实现端到端的语音理解和对话互动,以及将文本转换为自然听起来的语音。在一个单独的人工分析词错误率指数中,阿里巴巴的 Fun-Realtime-ASR 模型以 1.8% 的词错误率排名第一,这意味着每 100 个单词中不到两个单词被错误转录。这个突破解决了亚洲语音技术长期以来的瓶颈。根据百度开发者中心 5 月的报告,传统的基于标准普通话训练的语音系统在口音说话者中的准确率低于 60%,而在地方方言中则降至 30% 以下。阿里巴巴一直在努力弥补这一差距。根据该公司的云部门,新模型支持 30 多种语言、七种主要中文方言和 20 多种地方口音。中国的人工智能开发者正越来越多地从通用聊天机器人转向将语音 AI 助手嵌入日常应用中,以寻求生成式 AI 技术的更广泛商业用途。对语音模型的行业关注反映了人们对语音接口可能成为各行业部署 AI 的关键入口的预期。作为人机交互最直观的形式之一,语音几乎不需要用户培训。与基于文本的接口相比,基于语音的 AI 系统通常被认为更容易被主流用户接受,因为它们需要更少的用户培训,并且可以在智能手机、智能音箱和车载助手等设备上更自然地操作。Fun-Realtime-TTS-Preview 还提供针对金融和医疗行业用例量身定制的企业级定制接口。例如,在医疗环境中,该系统可以实时将医生的口述笔记转换为结构化的临床记录。随着中国科技公司越来越关注为更专业的现实应用设计的 AI 系统,语音 AI 的扩展应运而生。然而,包括谷歌和 ElevenLabs 在内的美国公司仍然主导着许多全球商业语音应用和开发者生态系统。 ### 相关股票 - [BABA.US](https://longbridge.com/zh-CN/quote/BABA.US.md) - [OpenAI.NA](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) - [159998.CN](https://longbridge.com/zh-CN/quote/159998.CN.md) - [516190.CN](https://longbridge.com/zh-CN/quote/516190.CN.md) - [159855.CN](https://longbridge.com/zh-CN/quote/159855.CN.md) - [517770.CN](https://longbridge.com/zh-CN/quote/517770.CN.md) - [513770.CN](https://longbridge.com/zh-CN/quote/513770.CN.md) - [KWEB.US](https://longbridge.com/zh-CN/quote/KWEB.US.md) - [513040.CN](https://longbridge.com/zh-CN/quote/513040.CN.md) - [BABX.US](https://longbridge.com/zh-CN/quote/BABX.US.md) - [516620.CN](https://longbridge.com/zh-CN/quote/516620.CN.md) - [KBAB.US](https://longbridge.com/zh-CN/quote/KBAB.US.md) - [159805.CN](https://longbridge.com/zh-CN/quote/159805.CN.md) - [09988.HK](https://longbridge.com/zh-CN/quote/09988.HK.md) - [GOOGL.US](https://longbridge.com/zh-CN/quote/GOOGL.US.md) - [GOOG.US](https://longbridge.com/zh-CN/quote/GOOG.US.md) - [BIDU.US](https://longbridge.com/zh-CN/quote/BIDU.US.md) - [09888.HK](https://longbridge.com/zh-CN/quote/09888.HK.md) - [89988.HK](https://longbridge.com/zh-CN/quote/89988.HK.md) - [HBBD.SG](https://longbridge.com/zh-CN/quote/HBBD.SG.md) - [89888.HK](https://longbridge.com/zh-CN/quote/89888.HK.md) ## 相关资讯与研究 - [招商证券:中国 AI 互联网行业估值仍吸引 首选阿里、智谱、快手等](https://longbridge.com/zh-CN/news/289543841.md) - [北水动向 | 北水成交净卖出 39.42 亿 LABUBU 现身世界杯开幕式 内资加仓泡泡玛特近 4 亿港元](https://longbridge.com/zh-CN/news/289579234.md)