QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型

4个月前发布 155 00

QA-MDT（Quality-aware Masked Diffusion Transformer）是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强的音乐，创新的质量感知训练策略，在训练过程中识别并提升音乐波形的质量。QA-MDT结合掩蔽扩散变换器（MDT）和质量控制技术，实现在大规模数据集上...

收录时间：

2025-12-16

打开网站手机查看

QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型

QA-MDT – 中科大联合科大讯飞推出开源音乐生成模型

QA-MDT（Quality-aware Masked Diffusion Transformer）是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强的音乐，创新的质量感知训练策略，在训练过程中识别并提升音乐波形的质量。QA-MDT结合掩蔽扩散变换器（MDT）和质量控制技术，实现在大规模数据集上的卓越性能，为音乐制作和多媒体创作提供强大的工具。

官网：https://github.com/QA-MDT

立即打开官网

数据统计

相关导航

ChatMusician – 可理解和生成音乐的大模型

ChatMusician是由Multimodal Art P...

谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm（中文名称：谛韵）是西北工业大学与香港...

Seed-Music – 字节跳动推出的AI音乐生成大模型

Seed-Music是字节跳动推出的 AI音乐生成大模型...

INFP – 音频驱动的生成逼真面部表情和头部姿态的AI框架

INFP是音频驱动的头部生成框架，专为双人对话交互设计。能自...

Pollinations.AI – 开源AI内容生成平台，提供免费文本和图像生成API

Pollinations.AI 是开源的AI内容生成平台，提...

创音岛 – AI音乐创作平台，支持录音转文字、配音、AI写歌

创音岛是集录音转文字、配音和AI写歌于一体的音乐创作平台 ...

Manifest – AI心理健康应用，根据情绪状态定制化心里健康对话

Manifest是Amy Wu推出的基于AI技术的心理健康应...

MusicFX – 谷歌推出的免费的AI音乐生成工具

Google MusicFX是谷歌推出的一款免费的人工智能音...