SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型
SpeechGPT 2.0-preview 是复旦大学 Op...
百聆(Bailing)是开源的语音对话助手,基于 语音识别 (ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术实现与用户的自然语音对话,实现类GPT-4o的对话效果。百聆无需GPU即可运行,端到端时延低至800ms,适用于各种边缘设备和低资源环境。百聆具备高效开源模型、无需GPU、模块化设计、支持记忆功能、支持工具调用、支持任务管理等项目特点,提供高质量的语音对话体验。