yujianwandou

帅气的我简直无法用语言描述!
MVoT – 微软联合剑桥和中科院推出的多模态推理可视化框架

MVoT – 微软联合剑桥和中科院推出的多模态推理可视化框架

MVoT(Multimodal Visualization...
340
MVGenMaster – 复旦联合阿里等实验室推出的多视图扩散模型

MVGenMaster – 复旦联合阿里等实验室推出的多视图扩散模型

MVGenMaster是复旦大学、阿里巴巴达摩院和湖潘实验室...
400
MVDrag3D – 南洋理工大学推出的拖拽式多视图3D编辑技术

MVDrag3D – 南洋理工大学推出的拖拽式多视图3D编辑技术

MVDrag3D是创新的3D编辑框架,结合多视图生成和重建先...
350
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力

MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力

MV-MATH 是中科院自动化所提出的新基准数据集,评估多模...
350
MV-Adapter – 北航联合 VAST 等开源的多视图一致图像生成模型

MV-Adapter – 北航联合 VAST 等开源的多视图一致图像生成模型

MV-Adapter是多视图一致图像生成模型,是北京航空航天...
480
Muyan-TTS – 开源文本转语音模型,零样本语音合成

Muyan-TTS – 开源文本转语音模型,零样本语音合成

Muyan-TTS 是为播客场景设计的开源 文本转语音 (T...
390
Muse AI – AI音乐创作应用,三种创作模式生成完整的个性化音乐作品

Muse AI – AI音乐创作应用,三种创作模式生成完整的个性化音乐作品

Muse AI是基于AI技术的音乐创作应用,简化音乐创作流程...
720
MUMU – 文本和图像驱动的多模态生成模型

MUMU – 文本和图像驱动的多模态生成模型

MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像...
370
Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型

Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型

Multiverse是以色列团队Enigma Labs推出的...
380
MultiTalk – 音频驱动的多人对话视频生成框架

MultiTalk – 音频驱动的多人对话视频生成框架

MultiTalk 是中山大学深圳校区、美团和香港科技大学联...
490
Multimodal Live API – 谷歌推出支持多模态交互、低延迟实时互动的AI接口

Multimodal Live API – 谷歌推出支持多模态交互、低延迟实时互动的AI接口

Multimodal Live API 是谷歌推出的低延迟...
600
MultiFoley – Adobe 联合密歇根大学推出的音效生成系统

MultiFoley – Adobe 联合密歇根大学推出的音效生成系统

MultiFoley是Adobe Research和密歇根大...
440