ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

4个月前发布 151 00

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架，基于微调预训练的文本到视频模型，引入过渡标记和局部注意力掩码策略，实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性，支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集...

收录时间：

2025-12-16

打开网站手机查看

ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架，基于微调预训练的文本到视频模型，引入过渡标记和局部注意力掩码策略，实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性，支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集的新方法，基于采样、分割和拼接视频片段来生成训练数据。

官网：https://arxiv.org/pdf/2505.07652

立即打开官网

数据统计

相关导航

腾讯混元文生视频 – 腾讯推出的AI视频生成模型

腾讯混元文生视频是基于腾讯 AI视频生成模型推出的AI视频...

Long-VITA – 腾讯优图联合南大、厦大开源的多模态模型

Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源...

EMO – 阿里推出的AI肖像视频生成框架

EMO（Emote Portrait Alive）是一个由阿...

众影AI – AI动画生成工具，自动分析剧本和音频生成动画作品

众影AI是 AI视频生成工具，专注于轻动画创作。基于自研的...

Pollo AI – 一站式AI图像和视频创作平台

Pollo AI 是新加坡公司 HIX.AI 推出的一站式A...

GPDiT – 清华北大联合阶跃星辰等推出的视频生成模型

GPDiT（Generative Pre-trained A...

VideoJAM – Meta 推出增强视频生成模型运动连贯性的框架

VideoJAM是Meta推出的，用在增强视频生成模型运...

MoCha – Meta 联合滑铁卢大学推出的端到端对话角色视频生成模型

MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端...