Chatterbox – Resemble AI开源的文本转语音模型

4个月前发布 101 00

Chatterbox是 Resemble AI 推出的开源文本转语音（TTS）模型。模型基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练，性能直逼甚至超越部分闭源系统。Chatterbox支持零样本语音克隆，仅需5秒参考音频生成高度逼真的个性化语音。Chatterbox独特的情感夸张控制功能，能调节情绪、语速和语调，为内...

收录时间：

2025-12-16

打开网站手机查看

Chatterbox – Resemble AI开源的文本转语音模型

Chatterbox – Resemble AI开源的文本转语音模型

Chatterbox是 Resemble AI 推出的开源文本转语音（TTS）模型。模型基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练，性能直逼甚至超越部分闭源系统。Chatterbox支持零样本语音克隆，仅需5秒参考音频生成高度逼真的个性化语音。Chatterbox独特的情感夸张控制功能，能调节情绪、语速和语调，为内容创作提供灵活性。Chatterbox具备超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用交互式应用。

官网：https://github.com/resemble-ai/chatterbox

立即打开官网

数据统计

相关导航

Vui – Fluxions-AI开源的轻量级语音对话模型

Vui 是 Fluxions-AI 团队开源的轻量级语音对话...

TIGER – 清华大学推出的轻量级语音分离模型

TIGER（Time-frequency Interleav...

Aider – 开源AI编程助手，基于命令行指定自动完成代码修改

Aider 是开源的 AI辅助编程工具，基于终端与大型语言...

Spirit LM – Meta推出多模态语言模型，无缝集成语音和文本

Spirit LM是由Meta AI团队推出的一种多模态语言...

CosyVoice 2.0 – 阿里开源的语音生成大模型

CosyVoice 2.0 是阿里巴巴通义实验室推出的Cos...

clone-voice – 开源的声音克隆工具，支持16种语言

Clone-voice是开源的声音克隆工具，基于深度学习...

Speech-02 – MiniMax 推出的新一代文本转语音模型

Speech-02 是 MiniMax 推出的新一代文本到...

CleanS2S – 流式语音到语音交互智能体原型，同时进行听和说

CleanS2S是一个流式语音到语音（S2S）交互智能体原型...