Parler-TTS – Hugging Face开源的文本转语音模型

4个月前发布 115 00

Parler-TTS是由Hugging Face推出的一款开源的文本到语音（TTS）模型，能够通过输入提示描述模仿特定说话者的风格（性别、音调、说话风格等），生成高质量、听起来自然的语音。该轻量级的TTS模型是完全开源的，包括所有数据集、预处理、训练代码和权重都公开，旨在促进高质量、可控制的TTS模型的创新发展。Parler-TTS的架构...

收录时间：

2025-12-16

打开网站手机查看

Parler-TTS – Hugging Face开源的文本转语音模型

Parler-TTS – Hugging Face开源的文本转语音模型

Parler-TTS是由Hugging Face推出的一款开源的文本到语音（TTS）模型，能够通过输入提示描述模仿特定说话者的风格（性别、音调、说话风格等），生成高质量、听起来自然的语音。该轻量级的TTS模型是完全开源的，包括所有数据集、预处理、训练代码和权重都公开，旨在促进高质量、可控制的TTS模型的创新发展。Parler-TTS的架构基于MusicGen，包含文本编码器、解码器和音频编解码器，通过集成文本描述和添加嵌入层优化了声音生成。

官网：https://github.com/huggingface/parler-tts

立即打开官网

数据统计

相关导航

Phi-4-Multimodal – 微软最新推出的多模态语言模型

Phi-4-Multimodal 是微软最新推出的多模态语言...

ChatTTSPlus – 开源文本转语音工具，ChatTTS扩展版支持语音克隆

ChatTTSPlus是 ChatTTS 的扩展版本，增加了...

ebook2audiobookXTTS – 开源电子书转有声书 AI 工具，支持16种语言

ebook2audiobookXTTS是开源的AI工具，能将...

EmoxCare – AI心理咨询师，提供针对性的疗愈指导

EmoxCare是免费的AI心里咨询师，帮助用户进行心理健康...

NotesGPT – 开源的AI语音笔记工具，实时转录文本自动生成行动项

NotesGPT是一款开源的AI驱动语音笔记工具，能将用户的...

Westlake-Omni – 西湖心辰开源的中文情感端到端语音交互模型

Westlake-Omni 是西湖心辰推出的全球首个开源中文...

MiniCPM-o 2.6 – 面壁智能开源的多模态大模型，性能媲美GPT-4o

MiniCPM-o 2.6 是MiniCPM-o 系列最新...

Voila – 开源端到端语音大模型，实现低延迟语音对话

Voila 是开源的端到端语音大模型，专为语音交互而设计。具...