DiffSensei – AI 漫画生成框架，能生成可控的黑白漫画面板

4个月前发布 99 00

DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架，能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多模态大型语言模型（MLLM），实现对漫画中多角色外观和互动的精确控制。框架用掩码交叉注意力机制和MLLM适配器，根据文本提示动态调整角色特征，包括表情、姿势和动作，生成...

收录时间：

2025-12-16

打开网站手机查看

DiffSensei – AI 漫画生成框架，能生成可控的黑白漫画面板

DiffSensei – AI 漫画生成框架，能生成可控的黑白漫画面板

DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架，能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多模态大型语言模型（MLLM），实现对漫画中多角色外观和互动的精确控制。框架用掩码交叉注意力机制和MLLM适配器，根据文本提示动态调整角色特征，包括表情、姿势和动作，生成具有连贯性和视觉吸引力的漫画面板。DiffSensei引入MangaZero数据集，支持多角色、多状态的漫画生成任务。

官网：https://github.com/jianzongwu/DiffSensei

立即打开官网

数据统计

相关导航

ScribbleDiff – 开源的涂鸦内容转换成图像的生成技术

ScribbleDiff是一种先进的文本到图像生成技术，基于...

SmolLM2 – Hugging Face推出的紧凑型大语言模型

SmolLLM2是Hugging Face推出用在设备端应用...

DiffSplat – 北大联合字节推出的 3D 生成框架

DiffSplat是新型的 3D 生成方法，从文本提示和单视...

Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型

Infinite Mobility 是上海AI Lab推出的...

LMMs-Eval – 专为多模态AI模型设计的统一评估框架

LMMs-Eval 是一个专为多模态AI模型设计的统一评估框...

Nemotron-Mini-4B-Instruct – 英伟达推出的开源小型语言模型

Nemotron-Mini-4B-Instruct是英伟达推...

Vibe Draw – AI 3D建模工具，涂鸦草图一键转为3D模型

Vibe Draw是开源的 AI 3D建模工具，支持将用户...

EnerVerse – 智元机器人推出的首个机器人4D世界模型

EnerVerse 是智元机器人团队开发的首个机器人4D世界...