MAGREF – 字节跳动推出的多主体视频生成框架

4个月前发布 110 00

MAGREF（Masked Guidance for Any‑Reference Video Generation）是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示，能生成高质量、主体一致的视频，支持单人、多人及人物与物体、背景的复杂交互场景。基于区域感知动态掩码和像素级通道拼接机制，MAGREF能精准复刻身...

收录时间：

2025-12-16

打开网站手机查看

MAGREF – 字节跳动推出的多主体视频生成框架

MAGREF – 字节跳动推出的多主体视频生成框架

MAGREF（Masked Guidance for Any‑Reference Video Generation）是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示，能生成高质量、主体一致的视频，支持单人、多人及人物与物体、背景的复杂交互场景。基于区域感知动态掩码和像素级通道拼接机制，MAGREF能精准复刻身份特征，保持视频中人物、物体和背景的协调性与一致性，适用内容创作、广告制作等多种场景，展现极强的生成能力和可控性。

官网：https://github.com/MAGREF-Video/MAGREF

立即打开官网

数据统计

相关导航

Clapper – 免费开源的可视化AI视频编辑工具

Clapper 是一款免费开源的可视化AI视频编辑工具，由 ...

ID-Animator – 腾讯等推出的个性化人物视频生成框架

ID-Animator是由来自腾讯光子工作室、中科大和中科院...

Aether – 上海 AI Lab 开源的生成式世界模型

Aether 是上海AI Lab开源的生成式世界模型，完全基...

AutoVFX – 自然语言驱动的视频特效编辑框架

AutoVFX是先进的物理特效框架，是伊利诺伊大学香槟分校研...

Emu3 – 北京智源推出的统一输入与生成多模态模型

Emu3是由北京智源人工智能研究院推出的一款原生多模态世界模...

OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架

OmniCam 是先进的多模态视频生成框架，通过摄像机控...

X-Prompt – 用于多模态视频目标分割的通用框架

X-Prompt是用于多模态视频目标分割的通用框架，解决传统...

Goku – 港大和字节联合推出的最新视频生成模型

Goku是香港大学和字节跳动联合发布的最新视频生成模型...