Moonshine – 实时转录场景、低延时高准确的语音识别模型

4个月前发布 103 00

Moonshine是专为资源受限设备优化的语音识别模型，提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景，例如现场转录和语音命令识别。Moonshine基于先进的编码器-解码器架构和旋转位置嵌入技术，提高模型在处理不同长度音频输入时的效率。与OpenAI的Whisper模型相比，Moonshine在多个标准数据集上展现出更低...

收录时间：

2025-12-16

打开网站手机查看

Moonshine – 实时转录场景、低延时高准确的语音识别模型

Moonshine – 实时转录场景、低延时高准确的语音识别模型

Moonshine是专为资源受限设备优化的语音识别模型，提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景，例如现场转录和语音命令识别。Moonshine基于先进的编码器-解码器架构和旋转位置嵌入技术，提高模型在处理不同长度音频输入时的效率。与OpenAI的Whisper模型相比，Moonshine在多个标准数据集上展现出更低的词错误率，且计算需求与音频长度成比例，让短音频的处理速度显著提升。Moonshine非常适合在边缘设备上部署，为实时语音识别应用提供新的解决方案。

官网：https://github.com/usefulsensors/moonshine

立即打开官网

数据统计

相关导航

Dolphin – 清华联合海天瑞声推出的语音识别大模型

Dolphin是清华大学电子工程系语音与音频技术实验室联合海...

Lobe Chat – 免费开源的高性能AI聊天机器人框架

Lobe Chat是一个免费开源的高性能 AI聊天机器人框...

AgenticSeek – 开源本地通用AI Agent，自主执行任务

AgenticSeek是完全本地化的开源AI助手，是 Man...

AstrBot – 开源多平台聊天机器人及开发框架

AstrBot是多平台聊天机器人及开发框架，支持多种大语言模...

FireRedASR – 小红书开源的自动语音识别模型

FireRedASR 是小红书开源的工业级自动语音识别 ...

VoiceCraft – 开源的语音编辑和文本转语音模型

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开...

蓝心大模型 – vivo推出的全新自研通用大模型矩阵，30亿端侧大模型

蓝心大模型是vivo发布的全新自研通用大模型矩阵，包括语言大...

Freestyler – 西工大联合微软和香港大学推出的说唱乐生成模型

Freestyler是西北工业大学计算机科学学院音频、语音与...