Faster Whisper – 一款高效语音识别工具，实现高速转写和快速推理

4个月前发布 105 00

Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具，运用CTranslate2引擎实现快速推理。在保持高准确度的同时，提升语音转写速度，降低内存使用，能处理大型音频文件。Faster Whisper 支持多种语言，适用于实时语音转写、视频字幕生成、客户服务、医疗记录转录等多个场景。核心技术包括 8 ...

收录时间：

2025-12-16

打开网站手机查看

Faster Whisper – 一款高效语音识别工具，实现高速转写和快速推理

Faster Whisper – 一款高效语音识别工具，实现高速转写和快速推理

Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具，运用CTranslate2引擎实现快速推理。在保持高准确度的同时，提升语音转写速度，降低内存使用，能处理大型音频文件。Faster Whisper 支持多种语言，适用于实时语音转写、视频字幕生成、客户服务、医疗记录转录等多个场景。核心技术包括 8 位量化，进一步优化了在 CPU 和 GPU 上的运行效率。Faster Whisper 提供API方便开发者集成到各种应用中。

官网：https://github.com/guillaumekln/faster-whisper

立即打开官网

数据统计

相关导航

PhotoPrism – 开源的AI照片管理工具，AI驱动的照片分类和搜索功能

PhotoPrism 是一个开源的AI照片管理工具，用 Go...

cogvlm2-llama3-caption – 智普AI开源的视频标注模型，生成文本描述

cogvlm2-llama3-caption模型是一个基于C...

AI-Media2Doc – 开源AI图文创作助手，一键将音视频内容转为文档

AI-Media2Doc 是开源的音视频转文档工具，基于AI...

VideoFusion – AI视频剪辑工具，自动去除视频黑边、水印和字幕

VideoFusion 是开源的短视频拼接与处理软件，专为高...

CAT4D – 谷歌和哥伦比亚大学等高校推出的单目视频创建4D场景方法

CAT4D是Google DeepMind、哥伦比亚大学和加...

Gemma 3n – 谷歌推出的端侧多模态AI模型

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态...

Notato – AI笔记应用，自动生成结构化笔记内容

Notato 是AI笔记应用，专为高效学习和工作设计。能将音...

YouMind

YouMind 是前阿里员工玉伯推出的专注提升创作效率和信息...