MiniMates – 轻量级AI数字人项目,支持语音和表情两种驱动模式
MiniMates是高性能的轻量级数字人驱动算法,具备语音和...
MegaTTS 3是字节跳动与浙江大学合作推出的零样本 文本到语音 合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容、音色、韵律等属性分别建模,支持中文、英文及中英混合语音合成,具备超高音质的 语音克隆 能力,几秒音频样本能模仿目标声音。支持口音强度控制等可控性功能。MegaTTS 3可应用于语音合成、语音编辑、跨语言语音合成等多个场景。