资讯快报视频 FM 发现交流合作

登录

汽车金融全部推荐 AGI 新出行新消费出海互联网新科技其他

小米开源 ZipVoice 语音模型：6.8 千小时数据集加持，零样本模仿人声仅需 0.5 秒

管理员 2025-09-12 · 129阅读

收录于 AGI 持续更新中

　　9 月 12 日消息，小米集团 AI 实验室新一代 Kaldi 团队，近期发布基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型，包含 ZipVoice 与 ZipVoice-Dialog 两款产品。

　　9 月 12 日消息，小米集团 AI 实验室新一代 Kaldi 团队，近期发布基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型，包含 ZipVoice 与 ZipVoice-Dialog 两款产品。

　　其中，ZipVoice 作为零样本单说话人语音合成模型，可解决现有同类模型参数量大、合成速度慢的痛点;ZipVoice-Dialog 为零样本对话语音合成模型，能突破现有对话语音合成模型在稳定性与推理速度上的瓶颈。(广角观察)

推荐AGI

最新 AGI 更多

20:35:29 罗曼股份关联合同相关公告要点
20:34:58 中国中免签署北京首都机场免税项目合同
20:34:27 超捷股份股价异常波动公告
20:33:12 *ST惠程获重整投资人3000万元无偿捐赠
20:32:27 上纬新材：机器人业务未量产，仍在研发中
20:31:43 长安汽车拟 60 亿元定增募资投向新能源与数智平台
20:28:56 55.5 万美元年薪！OpenAI 急招应变准备主管，奥特曼直言压力拉满
20:28:07 蚂蚁阿福：专注问答，拒绝广告与排名
20:23:31 腾讯元宝 “任务” 功能上线
20:22:52 京东联手宇树科技，12 月 31 日北京开首家机器人体验店，科技爱好者别错过！
21:15:56 LeCun新创AI公司估值瞄准30亿欧元，引行业关注
21:15:05 美团LongCat-Video-Avatar模型开源发布
21:14:24 南方航空与阿里云联合发布“天盾”安全大模型
21:13:25 摩根士丹利重磅预测：2050 年人形机器人市场达 5 万亿美元
21:52:26 中芯国际、佰维存储两融折算率回调：分别恢复至 70%、50%

Copyright © 2025 江苏星火报刊社有限公司版权所有

苏公网安备 11011xxxxx号苏ICP备2025192616号-1