VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成
VoxInstruct 是由清华大学开源的语音合成技术,能根...
SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检测框架,保护用户隐私的同时检测音频伪造。采用基于神经音频编解码器的解耦模型,分离语音的声学信息和语义信息,用声学信息进行检测,有效防止隐私泄露。SafeEar在多个基准数据集上表现优异,等错误率(EER)低至2.02%,能抵御内容恢复攻击。SafeEar提供了多语言支持,构建了包含150万条多语种音频数据的CVoiceFake数据集,为语音伪造检测研究提供了宝贵的资源。