Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型

4个月前发布 111 00

Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型，基于20万小时的人工转录英语数据训练而成。模型在长语音识别领域表现卓越，适合处理如播客和财报电话会议等场景。Reverb ASR支持用户控制输出文本的逐字程度，支持从完全逐字到非逐字的不同风格，满足精确转录和提高可读性的需求。Reverb ASR提供多种解码模式，包括...

收录时间：

2025-12-16

打开网站手机查看

Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型

Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型

Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型，基于20万小时的人工转录英语数据训练而成。模型在长语音识别领域表现卓越，适合处理如播客和财报电话会议等场景。Reverb ASR支持用户控制输出文本的逐字程度，支持从完全逐字到非逐字的不同风格，满足精确转录和提高可读性的需求。Reverb ASR提供多种解码模式，包括注意力解码和CTC前缀束搜索，适应不同的识别任务。在长篇幅语音识别方面，Reverb ASR的性能超过现有的开源模型，如OpenAI的Whisper和NVIDIA的Canary-1B。

官网：https://github.com/revdotcom/reverb/tree/main/asr

立即打开官网

数据统计

相关导航

Kokoro-TTS – 轻量级文本转语音模型，支持多语言多语音风格生成

Kokoro-TTS 是 hexgrad 开发的轻量级文本...

Voila – 开源端到端语音大模型，实现低延迟语音对话

Voila 是开源的端到端语音大模型，专为语音交互而设计。具...

CleanS2S – 流式语音到语音交互智能体原型，同时进行听和说

CleanS2S是一个流式语音到语音（S2S）交互智能体原型...

EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型

EMOVA（EMotionally Omni-present...

Lyra – SmartMore联合多所高校推出的增强多模态交互能力

Lyra是香港中文大学、SmartMore和香港科技大学推出...

陌生人闹钟 – AI闹钟应用，随机陌生人叫你起床的社交软件

陌生人闹钟是一款创新的闹钟应用，通过AI技术连接全球用户，让...

Speech-02 – MiniMax 推出的新一代文本转语音模型

Speech-02 是 MiniMax 推出的新一代文本到...

MARS5-TTS – 开源的AI声音克隆工具，支持140+语言

MARS5-TTS是CAMB.AI推出开源的 AI声音克隆工...