Muyan-TTS – 开源文本转语音模型，零样本语音合成

4个月前发布 110 00

Muyan-TTS 是为播客场景设计的开源文本转语音（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配，进行个性化语音定制。Muyan-TTS 合成速度快，0.33秒能生成1秒音频，适合实时应用。Muyan-TTS 能自然连贯地合成长篇内容，如...

收录时间：

2025-12-16

打开网站手机查看

Muyan-TTS – 开源文本转语音模型，零样本语音合成

Muyan-TTS – 开源文本转语音模型，零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配，进行个性化语音定制。Muyan-TTS 合成速度快，0.33秒能生成1秒音频，适合实时应用。Muyan-TTS 能自然连贯地合成长篇内容，如播客、有声书等，支持本地部署和API使用，方便集成到各种应用中。

官网：https://github.com/MYZY-AI/Muyan-TTS

立即打开官网

数据统计

相关导航

Open NotebookLM – 开源的PDF转播客AI工具，能自定义语气

Open NotebookLM 是一个开源的AI工具，基于最...

Whispo – AI语音转录工具，一键录音与转写

Whispo是AI驱动的语音转录工具，支持用户按住Ctrl键...

Kokoro-TTS – 轻量级文本转语音模型，支持多语言多语音风格生成

Kokoro-TTS 是 hexgrad 开发的轻量级文本...

EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型

EMOVA（EMotionally Omni-present...

PodAgent – 港中文、微软、小红书联合推出的播客生成框架

PodAgent 是香港中文大学、微软和小红书联合推出的播客...

AstrBot – 开源多平台聊天机器人及开发框架

AstrBot是多平台聊天机器人及开发框架，支持多种大语言模...

Baichuan-Audio – 百川智能开源的端到端语音交互模型

Baichuan-Audio是百川智能推出的端到端音频大语言...

Freestyler – 西工大联合微软和香港大学推出的说唱乐生成模型

Freestyler是西北工业大学计算机科学学院音频、语音与...