Kimi-Audio – Moonshot AI 开源的音频基础模型
Kimi-Audio 是 Moonshot AI 推出的开源...
InspireMusic 是阿里巴巴通义实验室开源的 音乐生成 技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简单的文字描述或音频提示快速生成多种风格的音乐。InspireMusic 的核心架构包括音频 tokenizer、自回归 Transformer 模型、扩散模型(CFM)和 Vocoder,能实现文本生成音乐、音乐续写等功能。