AnimateAnything – 浙江大学联合北航推出的统一可控视频生成技术
AnimateAnything是浙江大学和北京航空航天大学研...
CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时间连贯性,支持用户精确控制相机运动,同时保留对象运动。CAVIA的设计灵活性使其能与多种数据源联合训练,显著提升视频的几何一致性和感知质量,在虚拟现实、增强现实和电影制作等领域具有应用潜力。