CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架

1个月前发布 33 00

CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时间连贯性,支持用户精确控制相机运动,同时保留对象运动。CAVIA的设计灵活性使其能与多种数据源联合训练,显著提升视频的几何一致性和感知质量,在虚拟现实、增强现...

收录时间:
2025-12-16
CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架

CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时间连贯性,支持用户精确控制相机运动,同时保留对象运动。CAVIA的设计灵活性使其能与多种数据源联合训练,显著提升视频的几何一致性和感知质量,在虚拟现实、增强现实和电影制作等领域具有应用潜力。

官网:https://arxiv.org/pdf/2410.10774


立即打开官网

数据统计

相关导航