ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

1个月前发布 50 00

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头 视频生成 的框架,基于微调预训练的 文本到视频 模型,引入过渡标记和局部注意力掩码策略,实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性,支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集...

收录时间:
2025-12-16
ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头 视频生成 的框架,基于微调预训练的 文本到视频 模型,引入过渡标记和局部注意力掩码策略,实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性,支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集的新方法,基于采样、分割和拼接视频片段来生成训练数据。

官网:https://arxiv.org/pdf/2505.07652


立即打开官网

数据统计

相关导航