EzAudio – 腾讯联合约翰霍普金斯大学推出的文本到音频生成模型
EzAudio是由约翰霍普金斯大学和腾讯AI实验室共同推出的...
SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的 AI音乐生成模型 ,能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双序列语言模型(DSLM)和注意力掩码策略,理解和生成各种相关的歌曲生成任务,包括编辑和生成。SongCreator在多项任务中表现出色,特别是在歌词到歌曲和歌词到声乐的任务上,能独立控制生成歌曲中声乐和伴奏的声学条件。