SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架

4个月前发布 149 00

SketchVideo 是中国科学院大学，香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图，结合文本提示，实现对视频的空间布局和运动的精细控制。框架基于 DiT 视频生成模型，设计高效的草图控制网络，包含草图控制块和帧间注意力机制，能将稀疏的关键帧草图条件传播到所有视频帧中。SketchVideo 支持...

收录时间：

2025-12-16

打开网站手机查看

SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架

SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架

SketchVideo 是中国科学院大学，香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图，结合文本提示，实现对视频的空间布局和运动的精细控制。框架基于 DiT 视频生成模型，设计高效的草图控制网络，包含草图控制块和帧间注意力机制，能将稀疏的关键帧草图条件传播到所有视频帧中。SketchVideo 支持对真实或合成视频的细粒度编辑，基于视频插入模块和潜在融合技术，确保新内容与原始视频在空间和时间上的一致性，保留未编辑区域的细节。

官网：https://github.com/IGLICT/SketchVideo

立即打开官网

数据统计

相关导航

Mini-LLaVA – 基于Llama 3.1的轻量级多模态大语言模型

Mini-LLaVA是一款轻量级的多模态大语言模型，由清华大...

VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+（VideoVAE Plus）是香港科技大...

Motion Dreamer – 香港科技大学推出的运动合理视频生成框架

Motion Dreamer是香港科技大学（广州）研究者提出...

BoldVoice – AI英语口音训练应用，AI实时评分提升发音水平

BoldVoice 是专注于英语口音训练的应用程序，帮助非英...

VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型

VITRON是Skywork AI、新加坡国立大学和南洋理工...

FlashVideo – 字节联合港大推出的高分辨率视频生成框架

FlashVideo是字节跳动团队提出的高效的高分辨率视频...

Seaweed APT – 字节跳动推出的单步图像和视频生成项目

Seaweed APT是字节跳动推出的对抗性后训练（Adve...

MOFA-Video – 腾讯开源的可控性AI图生视频模型

MOFA-Video是由腾讯AI实验室和东京大学的研究人员开...