yujianwandou

帅气的我简直无法用语言描述！

文章9 网址2062 评论0

MVoT – 微软联合剑桥和中科院推出的多模态推理可视化框架

MVoT（Multimodal Visualization...

1100

MVGenMaster – 复旦联合阿里等实验室推出的多视图扩散模型

MVGenMaster是复旦大学、阿里巴巴达摩院和湖潘实验室...

1420

MVDrag3D – 南洋理工大学推出的拖拽式多视图3D编辑技术

MVDrag3D是创新的3D编辑框架，结合多视图生成和重建先...

1120

MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力

MV-MATH 是中科院自动化所提出的新基准数据集，评估多模...

1140

MV-Adapter – 北航联合 VAST 等开源的多视图一致图像生成模型

MV-Adapter是多视图一致图像生成模型，是北京航空航天...

1310

Muyan-TTS – 开源文本转语音模型，零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音（T...

1210

Muse AI – AI音乐创作应用，三种创作模式生成完整的个性化音乐作品

Muse AI是基于AI技术的音乐创作应用，简化音乐创作流程...

1880

MUMU – 文本和图像驱动的多模态生成模型

MUMU是一种多模态图像生成模型，通过结合文本提示和参考图像...

1180

Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型

Multiverse是以色列团队Enigma Labs推出的...

1160

MultiTalk – 音频驱动的多人对话视频生成框架

MultiTalk 是中山大学深圳校区、美团和香港科技大学联...

1640

Multimodal Live API – 谷歌推出支持多模态交互、低延迟实时互动的AI接口

Multimodal Live API 是谷歌推出的低延迟...

1590

MultiFoley – Adobe 联合密歇根大学推出的音效生成系统

MultiFoley是Adobe Research和密歇根大...

1540