9 月 12 日据小米技术消息近日小米集团 AI 实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的 ZipVoice 系列语音合成（TTS）模型——ZipVoice（零样本单说话人语音合成模型）与 ZipVoice-Dialog（零样本对话语音合成模型）。ZipVoice 解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点 ZipVoice-Dialog 则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈。

小米集团(ADR)

小米集团-W

<p>小米集团 AI 实验室发布了基于 Flow Matching 架构的 ZipVoice 系列语音合成模型，包括 ZipVoice 和 ZipVoice-Dialog。ZipVoice 旨在解决现有零样本语音合成模型的参数量大和合成速度慢的问题，而 ZipVoice-Dialog 则针对对话语音合成模型的稳定性和推理速度瓶颈进行优化。</p>

快讯