GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架

4个月前发布 101 00

GroundingBooth 是一个先进的文本到图像定制框架，由华盛顿大学圣路易斯分校、Adobe和普渡大学的研究团队共同推出。基于文本-图像对齐模块和遮罩交叉注意力层，实现对前景主体和背景对象的精确空间对齐。框架能生成在布局、身份保留和文本-图像连贯性方面都符合个性化需求的图像，支持多主题定制，在复杂场景中保持高准确性。Groundin...

收录时间：

2025-12-16

打开网站手机查看

GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架

GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架

GroundingBooth 是一个先进的文本到图像定制框架，由华盛顿大学圣路易斯分校、Adobe和普渡大学的研究团队共同推出。基于文本-图像对齐模块和遮罩交叉注意力层，实现对前景主体和背景对象的精确空间对齐。框架能生成在布局、身份保留和文本-图像连贯性方面都符合个性化需求的图像，支持多主题定制，在复杂场景中保持高准确性。GroundingBooth 是首个实现主题驱动的前景生成和文本驱动的背景生成联合接地的工作，为高度定制化的视觉内容创作提供了可能。

官网：https://arxiv.org/pdf/2409.08520v1

立即打开官网

数据统计

相关导航

Continue – AI代码助手，聊天式理解代码提供自动补全代码建议

Continue是开源的 AI 代码助手，集成在 VS C...

LightLab – 谷歌等机构推出的图像光源控制模型

LightLab是谷歌等机构推出的基于扩散模型的图像光源控制...

LaDeCo – 西安交大联合微软推出的自动图形设计构图方法

LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计...

Qwen2.5-1M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持1...

Umax – AI 面部分析应用，获得面部特征分析和个性化改进建议

Umax是基于人工智能的面部分析应用，旨在帮助用户提升面部吸...

Hero Stuff – AI物品销售助手，拍照识别物品自动生成商品描述

Hero Stuff是基于人工智能的二手物品销售助手工具。用...

PSHuman – 开源的单图像3D人像重建技术，仅需一张照片

PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视...

OmniSQL – 开源文本到 SQL 模型，自然语言转换为 SQL 查询语句

OmniSQL 是开源的文本到 SQL 模型，将自然语言问题...