阿里通義宣佈開源 Fun-CosyVoice3-0.5B,該版本提供了 zero-shot 音色克隆能力,只需要你提供一段 3 秒以上的參考音頻,即可復刻其音色併合成新語音,並且支持本地部署和二次開發。此外,通義推出輕量化版本 Fun-ASR-Nano 模型,總參數量壓縮到 0.8B,推理成本更低,現已開源,支持本地部署與定製化微調。(界面)