Step-Audio – 阶跃星辰开源的语音交互模型

1个月前发布 30 00

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Step-Audio基于130B参数的统一模型,将语音理解与生成相结合,支持 语音识别 、对话、 语音合成 等功能。Step-Audio 的核心优势包括:高效的语音数据生成引...

收录时间:
2025-12-16
Step-Audio – 阶跃星辰开源的语音交互模型Step-Audio – 阶跃星辰开源的语音交互模型

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Step-Audio基于130B参数的统一模型,将语音理解与生成相结合,支持 语音识别 、对话、 语音合成 等功能。Step-Audio 的核心优势包括:高效的语音数据生成引擎、支持多种情感和方言的精细语音控制能力,增强的工具调用和角色扮演功能,有效处理复杂任务。在性能方面,Step-Audio 在多个基准测试中表现出色,在指令遵循和复杂语音交互场景中展现显著的领先优势。

官网:https://github.com/stepfun-ai/Step-Audio


立即打开官网

数据统计

相关导航