CAT4D – 谷歌和哥伦比亚大学等高校推出的单目视频创建4D场景方法

4个月前发布 105 00

CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的，能从单目视频创建4D场景（动态3D）表示。CAT4D基于多视图视频扩散模型，能在任意指定的相机姿态和时间点合成新视图，并将单目视频转换为多视图视频，实现稳健的4D重建。CAT4D能从真实视频中生成4D场景，从生成的视频中创建4D内容，为电影制作、游戏...

收录时间：

2025-12-16

打开网站手机查看

CAT4D – 谷歌和哥伦比亚大学等高校推出的单目视频创建4D场景方法

CAT4D – 谷歌和哥伦比亚大学等高校推出的单目视频创建4D场景方法

CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的，能从单目视频创建4D场景（动态3D）表示。CAT4D基于多视图视频扩散模型，能在任意指定的相机姿态和时间点合成新视图，并将单目视频转换为多视图视频，实现稳健的4D重建。CAT4D能从真实视频中生成4D场景，从生成的视频中创建4D内容，为电影制作、游戏开发、虚拟现实等领域带来创新应用的可能。

官网：https://arxiv.org/pdf/2411.18613

立即打开官网

数据统计

相关导航

InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

InternVideo2.5是上海人工智能实验室联合南京大学...

mPLUG-Owl3 – 阿里巴巴推出的通用多模态AI模型

mPLUG-Owl3是阿里巴巴推出的通用多模态AI模型，专为...

VE-Bench – 北京大学开源首个针对视频编辑质量评估的新指标

VE-Bench 是北京大学的研究团队 MMCAL 最近发布...

MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法

MagicDriveDiT是香港中文大学、香港科技大学、华为...

ToonCrafter – 腾讯等开源的卡通动画视频插帧工具

ToonCrafter是由腾讯AI实验室、香港中文大学和香港...

Pollo AI – 一站式AI图像和视频创作平台

Pollo AI 是新加坡公司 HIX.AI 推出的一站式A...

UniEdit – 免训练调优的统一视频编辑框架

UniEdit是由浙江大学、微软研究院和北京大学的研究人员推...

Video-T1 – 清华联合腾讯推出的视频生成技术

Video-T1 是清华大学和腾讯的研究人员共同推出的视频...