GenXD – 新加坡国立和微软共同推出的通用3D和4D联合生成框架

4个月前发布 139 00

GenXD是新加坡国立大学和微软公司共同推出的3D-4D联合生成框架，能从任意数量的条件图像中生成高质量的3D和4D场景。框架用一个数据整理流程从视频中提取相机姿态和物体运动强度，基于这些信息及大规模4D数据集CamVid-30K训练模型。GenXD基于多视角时序模块解耦相机和物体的运动，用掩码潜在条件支持多种视角的条件生成，实现在单一模...

收录时间：

2025-12-16

打开网站手机查看

GenXD – 新加坡国立和微软共同推出的通用3D和4D联合生成框架

GenXD – 新加坡国立和微软共同推出的通用3D和4D联合生成框架

GenXD是新加坡国立大学和微软公司共同推出的3D-4D联合生成框架，能从任意数量的条件图像中生成高质量的3D和4D场景。框架用一个数据整理流程从视频中提取相机姿态和物体运动强度，基于这些信息及大规模4D数据集CamVid-30K训练模型。GenXD基于多视角时序模块解耦相机和物体的运动，用掩码潜在条件支持多种视角的条件生成，实现在单一模型中处理多种3D和4D生成任务。

官网：https://github.com/HeliosZhao/GenXD

立即打开官网

数据统计

相关导航

LongVU – Meta AI开源的长视频理解模型

LongVU是Meta AI团队推出的长视频理解模型，基于时...

SignLLM – 多语言手语生成模型，文字输入生成对应的手语视频

SignLLM 是创新的多语言手语生成模型，通过文字输入生成...

Seaweed APT – 字节跳动推出的单步图像和视频生成项目

Seaweed APT是字节跳动推出的对抗性后训练（Adve...

Stable Video 3D (SV3D) – 多视角合成和3D生成模型，由Stability AI推出

Stable Video 3D（简称SV3D）是由Stabi...

千音漫语 – AI声音创作助手，涵盖多种语言和音色

千音漫语是北京熠声科技推出的智能声音创作助手，为用户提供高效...

Apollo – Meta 联合斯坦福大学推出的大型多模态模型

Apollo是Meta和斯坦福大学合作推出的大型多模态模型...

Seed-ASR – 字节跳动推出的AI语音识别模型

Seed-ASR是字节跳动推出的一款基于大型语言模型（LLM...

Qwen2-VL – 阿里巴巴达摩院开源的视觉多模态AI模型

Qwen2-VL是阿里巴巴达摩院开源的视觉多模态AI模型，具...