Amphion – 开源的全能AI音频项目,面向音频、音乐和语音生成的工具包
Amphion是开源的音频、音乐和语音生成工具包,是香港中文...
Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Step-Audio基于130B参数的统一模型,将语音理解与生成相结合,支持 语音识别 、对话、 语音合成 等功能。Step-Audio 的核心优势包括:高效的语音数据生成引擎、支持多种情感和方言的精细语音控制能力,增强的工具调用和角色扮演功能,有效处理复杂任务。在性能方面,Step-Audio 在多个基准测试中表现出色,在指令遵循和复杂语音交互场景中展现显著的领先优势。