Westlake-Omni – 西湖心辰开源的中文情感端到端语音交互模型

4个月前发布 120 00

Westlake-Omni 是西湖心辰推出的全球首个开源中文情感端到端语音交互大模型。模型采用离散表示法，统一文本和语音模态的处理，特别强调实时性，快速响应用户输入，提供零延迟的交互体验。Westlake-Omni 在高质量中文情感语音数据集上进行深度训练，具备出色的情感理解和表达能力，能生成清晰、自然、富有表现力的中文语音。使模型能理解...

收录时间：

2025-12-16

打开网站手机查看

Westlake-Omni – 西湖心辰开源的中文情感端到端语音交互模型

Westlake-Omni – 西湖心辰开源的中文情感端到端语音交互模型

Westlake-Omni 是西湖心辰推出的全球首个开源中文情感端到端语音交互大模型。模型采用离散表示法，统一文本和语音模态的处理，特别强调实时性，快速响应用户输入，提供零延迟的交互体验。Westlake-Omni 在高质量中文情感语音数据集上进行深度训练，具备出色的情感理解和表达能力，能生成清晰、自然、富有表现力的中文语音。使模型能理解中文语境下的复杂情感，使语音交互更加人性化。

官网：https://github.com/xinchen-ai/Westlake-Omni

立即打开官网

数据统计

相关导航

ChatTTSPlus – 开源文本转语音工具，ChatTTS扩展版支持语音克隆

ChatTTSPlus是 ChatTTS 的扩展版本，增加了...

VITA-Audio – 开源的端到端多模态语音大模型，低延迟、推理快

VITA-Audio 是开源的端到端多模态语音大模型，具有低...

GLM-4-Voice – 智谱AI推出的端到端情感语音模型

GLM-4-Voice是智谱AI 推出的端到端情感语音模型...

EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型

EMOVA（EMotionally Omni-present...

Llasa TTS – 香港科技大学开源的文本转语音模型

Llasa TTS 是香港科技大学基于 LLaMA 架构推出...

10款免费好用的AI文本转语音的工具和网站，智能合成配音

近年来，由于人工智能和机器学习的发展，文本到语音（TTS）技...

Ciallo TTS – 在线AI文本转语音工具，支持长文本自动分段处理

Ciallo TTS是开源的在线文本转语音工具，支持超过...

MARS5-TTS – 开源的AI声音克隆工具，支持140+语言

MARS5-TTS是CAMB.AI推出开源的 AI声音克隆工...