QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型

1个月前发布 41 00

QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强的音乐,创新的质量感知训练策略,在训练过程中识别并提升音乐波形的质量。QA-MDT结合掩蔽扩散变换器(MDT)和质量控制技术,实现在大规模数据集上...

收录时间:
2025-12-16
QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型

QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强的音乐,创新的质量感知训练策略,在训练过程中识别并提升音乐波形的质量。QA-MDT结合掩蔽扩散变换器(MDT)和质量控制技术,实现在大规模数据集上的卓越性能,为音乐制作和多媒体创作提供强大的工具

官网:https://github.com/QA-MDT


立即打开官网

数据统计

相关导航