MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统

1个月前发布 24 00

MegaTTS 3是字节跳动与浙江大学合作推出的零样本 文本到语音 合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容、音色、韵律等属性分别建模,支持中文、英文及中英混合语音合成,具备超高音质的 语音克隆 能力,几秒音频样本能模仿目标声音。支持口音强度控制等可控性功能。MegaTTS 3可应用于语...

收录时间:
2025-12-16
MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统

MegaTTS 3是字节跳动与浙江大学合作推出的零样本 文本到语音 合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容、音色、韵律等属性分别建模,支持中文、英文及中英混合语音合成,具备超高音质的 语音克隆 能力,几秒音频样本能模仿目标声音。支持口音强度控制等可控性功能。MegaTTS 3可应用于语音合成、语音编辑、跨语言语音合成等多个场景。

官网:https://github.com/bytedance/MegaTTS3


立即打开官网

数据统计

相关导航