WeGen – 中科大联合上海交大等推出的统一多模态生成模型

4个月前发布 125 00

WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型，基于自然对话实现多样化的视觉生成任务。WeGen结合多模态大语言模型（MLLM）和扩散模型，处理文本到图像生成、条件驱动生成、图像编辑、风格迁移等多种任务。WeGen 的核心优势能在用户指令较模糊时提供多样化的创意输出，在用户有具体需求时保...

收录时间：

2025-12-16

打开网站手机查看

WeGen – 中科大联合上海交大等推出的统一多模态生成模型

WeGen – 中科大联合上海交大等推出的统一多模态生成模型

WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型，基于自然对话实现多样化的视觉生成任务。WeGen结合多模态大语言模型（MLLM）和扩散模型，处理文本到图像生成、条件驱动生成、图像编辑、风格迁移等多种任务。WeGen 的核心优势能在用户指令较模糊时提供多样化的创意输出，在用户有具体需求时保持生成结果与指令和参考图像的一致性。WeGen 基于动态实例一致性（DIIC）数据管道和提示自重写（PSR）机制，解决实例身份一致性和生成多样性两大挑战，展现出作为用户友好型设计助手的潜力。

官网：https://github.com/hzphzp/WeGen

立即打开官网

数据统计

相关导航

Context7 – 为大模型和AI编辑器提供最新文档和代码示例的平台

Context7 是 Upstash 推出的AI编程辅助工具...

Continue – AI代码助手，聊天式理解代码提供自动补全代码建议

Continue是开源的 AI 代码助手，集成在 VS C...

ConsiStory – 免训练实现主题一致性的文生图方法

ConsiStory是由NVIDIA和特拉维夫大学的研究人员...

ImagePulse – 魔搭社区开源的图像理解和生成模型数据集

ImagePulse （图律脉动）是魔搭社区推出的开源项...

ConsistentDreamer – 华为推出的单张图像生成 3D 资产技术

ConsistentDreamer 是华为慕尼黑研究中心提出...

燕雀光年

燕雀光年是在线 AI LOGO设计工具，帮助用户快速生成高...

Crack Coder – AI技术面试工具，提供实时编程问题支持

Crack Coder 是开源的隐形 AI 辅助工具，专为技...

GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架

GaussianAnything 是南洋理工大学 S-Lab...