TransPixar – 港中文联合 Adobe 等机构开源的生成透明背景视频技术
TransPixar是香港中文大学、Adobe研究院 、香港...
ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头 视频生成 的框架,基于微调预训练的 文本到视频 模型,引入过渡标记和局部注意力掩码策略,实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性,支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集的新方法,基于采样、分割和拼接视频片段来生成训练数据。