TEN VAD – AI实时语音活动检测系统,低延迟、轻量级、高精度
TEN VAD 是高性能的实时语音活动检测系统,专为企业级应...
Orpheus TTS 是基于 Llama-3b 架构的开源 文本到语音 (TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本 语音克隆 能力,无需预训练,模仿特定语音。Orpheus TTS 延迟低至约 200 毫秒,适合实时应用。Orpheus TTS 提供多种预训练和微调模型,用户基于少量数据进行定制化训练,满足不同场景的语音合成需求。