Dia – 开源文本转语音模型，支持生成自然逼真的对话语音

4个月前发布 152 00

Dia 是 Nari Labs 推出的开源文本转语音（TTS）模型，拥有 16亿参数，根据文本脚本直接生成高度逼真的对话语音，支持多说话者标记、情感语调控制以及非语言提示（如笑声、咳嗽声等），通过语音克隆功能生成与特定音频相似的声音。Dia 的代码和权重已在 Hugging Face 和 GitHub 上开源，用户可以下载并本地部...

收录时间：

2025-12-16

打开网站手机查看

Dia – 开源文本转语音模型，支持生成自然逼真的对话语音

Dia – 开源文本转语音模型，支持生成自然逼真的对话语音

Dia 是 Nari Labs 推出的开源文本转语音（TTS）模型，拥有 16亿参数，根据文本脚本直接生成高度逼真的对话语音，支持多说话者标记、情感语调控制以及非语言提示（如笑声、咳嗽声等），通过语音克隆功能生成与特定音频相似的声音。Dia 的代码和权重已在 Hugging Face 和 GitHub 上开源，用户可以下载并本地部署，也可以通过 Gradio 界面在线体验。

官网：https://github.com/nari-labs/dia

立即打开官网

数据统计

相关导航

EICopilot – 百度推出基于AI智能体的企业信息搜索与探索工具

EICopilot是百度研究院推出的基于AI智能体的企业信息...

MovieDreamer – 专为长视频研发的AI视频生成框架

MovieDreamer是浙江大学联合阿里巴巴专为长视频研发...

Kimi学术搜索 – Kimi推出的AI学术研究助手

Kimi学术搜索是Kimi推出的AI学术研究助手，可以帮助用...

WriteHERE – 开源的AI长文写作框架，单次生成超长文本

WriteHERE是Jürgen Schmidhuber领衔...

MM-StoryAgent – 上海交大联合阿里开源的多智能体故事绘本视频生成框架

MM-StoryAgent 是上海交通大学X-LANCE实验...

Qwen2.5-Turbo – 阿里推出的长文本模型，支持上下文长度1M tokens

Qwen2.5-Turbo是阿里推出的先进模型，将上下文长度...

podlm-public – 开源的AI博客生成工具，支持网页URL、文本转换成博客

podlm-public是一个开源AI播客工具，旨在创建一个...

Kerqu.Ai – AI电商图文生成工具，支持多语言文案生成和作图功能

Kerqu.Ai是杭州刻趣科技推出的跨境电商AI图文生成工具...