Fish Agent – Fish Audio推出的端到端语音处理模型

1个月前发布 31 00

Fish Agent是 Fish Audio 推出的创新的端到端语音处理模型,集成自动语音识别(ASR)和文本到语音(TTS)技术,无需传统的语义编码器/解码器,实现语音到语音的直接转换。模型经过700,000小时的多语言音频内容训练,支持包括英语、中文在内的多种语言,精准捕捉和生成环境音频信息。Fish Agent目前正处于测试阶段,基...

收录时间:
2025-12-16
Fish Agent – Fish Audio推出的端到端语音处理模型Fish Agent – Fish Audio推出的端到端语音处理模型

Fish Agent是 Fish Audio 推出的创新的端到端语音处理模型,集成自动语音识别(ASR)和文本到语音(TTS)技术,无需传统的语义编码器/解码器,实现语音到语音的直接转换。模型经过700,000小时的多语言音频内容训练,支持包括英语、中文在内的多种语言,精准捕捉和生成环境音频信息。Fish Agent目前正处于测试阶段,基于不断的优化和改进,为用户提供更准确、更自然的语音交互体验。

官网:https://github.com/fishaudio/fish-speech/blob/main/Start_Agent.md


立即打开官网

数据统计

相关导航