9 月 12 日消息,小米集团 AI 实验室新一代 Kaldi 团队,近期发布基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型,包含 ZipVoice 与 ZipVoice-Dialog 两款产品。
其中,ZipVoice 作为零样本单说话人语音合成模型,可解决现有同类模型参数量大、合成速度慢的痛点;ZipVoice-Dialog 为零样本对话语音合成模型,能突破现有对话语音合成模型在稳定性与推理速度上的瓶颈。(广角观察)
9 月 12 日消息,小米集团 AI 实验室新一代 Kaldi 团队,近期发布基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型,包含 ZipVoice 与 ZipVoice-Dialog 两款产品。
其中,ZipVoice 作为零样本单说话人语音合成模型,可解决现有同类模型参数量大、合成速度慢的痛点;ZipVoice-Dialog 为零样本对话语音合成模型,能突破现有对话语音合成模型在稳定性与推理速度上的瓶颈。(广角观察)