ViewCrafter – 北大、港中文联合腾讯提出的高保真新视图合成技术

4个月前发布 148 00

ViewCrafter 是北大和港中文联合腾讯提出的一种先进的视频扩散模型，能从单个或少量图像中合成高保真的新视图。结合了视频扩散模型的生成能力和基于点的3D表示，精确控制相机姿态生成高质量视频帧。通过迭代视图合成策略和相机轨迹规划，ViewCrafter 能逐步扩展3D线索，生成更广泛的新视图。在多个数据集上展现了强大的泛化能力和性能...

收录时间：

2025-12-16

打开网站手机查看

ViewCrafter – 北大、港中文联合腾讯提出的高保真新视图合成技术

ViewCrafter – 北大、港中文联合腾讯提出的高保真新视图合成技术

ViewCrafter 是北大和港中文联合腾讯提出的一种先进的视频扩散模型，能从单个或少量图像中合成高保真的新视图。结合了视频扩散模型的生成能力和基于点的3D表示，精确控制相机姿态生成高质量视频帧。通过迭代视图合成策略和相机轨迹规划，ViewCrafter 能逐步扩展3D线索，生成更广泛的新视图。在多个数据集上展现了强大的泛化能力和性能，为实时渲染的沉浸式体验和场景级文本到3D生成等应用提供了新的可能性。

官网：https://drexubery.github.io/ViewCrafter/

立即打开官网

数据统计

相关导航

Vidu 1.5 – 生数科技推出支持多主体一致性的多模态大模型

Vidu 1.5是生数科技推出的AI视频生成平台最新版本，致...

FancyVideo – 360推出的AI文生视频模型

FancyVideo是360联合中山大学推出的AI文生视频模...

MIMO – 阿里智能研究院推出的可控角色AI视频合成框架

MIMO是阿里巴巴集团智能计算研究所推出的可控角色视频合成的...

MultiTalk – 音频驱动的多人对话视频生成框架

MultiTalk 是中山大学深圳校区、美团和香港科技大学联...

Tavus – AI视频生成平台，支持数字人克隆和实时对话

Tavus 是先进的个性化 AI视频生成平台，支持创建高度...

GenMAC – 港大、清华联合微软推出文本到视频生成的多代理协作框架

GenMAC是香港大学、清华大学和微软研究院推出的多代理协作...

CogVideoX-5B-I2V – 智谱 AI 开源的图生视频生成模型

CogVideoX-5B-I2V 是智谱 AI 开源的一款图...

Animate-X – 阿里巴巴开源的通用动画生成框架

Animate-X是基于LDM的通用动画框架，能将静态图像转...