发布

小米最新开源！覆盖600+语种方言声音克隆TTS，只需3-10秒声音，可控一键合成声音，超40倍速OmniVoice

1个月前发布

021593

小米最新开源！覆盖600+语种方言声音克隆TTS，只需3-10秒声音，可控一键合成声音，超40倍速OmniVoice

软件介绍

OmniVoice是一款最先进的大规模多语言零样本文本到语音（TTS）模型，支持超过600种语言。该模型基于一种新颖的扩散语言模型架构，能够以卓越的推理速度生成高质量语音，并支持语音克隆和声音设计。

超广语言覆盖：支持600+语言，零样本TTS中覆盖最广。

零样本语音克隆：仅需3–10秒参考音频，无需训练即可复刻音色，质量顶尖。

自由语音设计：用文本指令控制性别、年龄、音高、口音/方言、耳语等，无需参考音。

极速推理：RTF低至0.025，比实时快40倍，适合批量与实时场景。

精细发音控制：支持笑声/叹气等非语言标记，支持拼音/音标强制纠音。

架构简洁高效：扩散语言模型结构，兼顾音质、速度与扩展性。

易用部署：一键启动Web UI，已经制作好了离线整合包给大家使用，大家有需要的可以试试。

完全开源：GitHub开源，可本地部署（已经可以本地离线运行了）、二次开发与商用友好。

PS:支持如下方言：

陕西话、河南、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话

适用设备

电脑软件

夸克网盘链接

*提示本文仅为课程介绍，不构成任何收益承诺，变现效果因人而异，需结合自身努力与实操，合理运用课程所学内容，同时严格遵守平台相关规则与相关法律法规*

© 版权声明

文章声明 1、本网站名称：星鸦资源网创
2、本站永久网址：http://www.xiaoyu.biz/
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权必删，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们，我们会第一时间更新。
7、使用本站服务即表示同意【免责声明】【用户服务及隐私协议】

THE END

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容