Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式

1个月前发布 27 00

Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及ControlNet引导生成,具备深度估计和线条检测功能,实现更精确的图像控制。Qwen2VL-Flux提供灵活的注意力机制和高分辨率输出,是一...

收录时间:
2025-12-16
Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式

Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及ControlNet引导生成,具备深度估计和线条检测功能,实现更精确的图像控制。Qwen2VL-Flux提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。

官网:https://github.com/erwold/qwen2vl-flux


立即打开官网

数据统计

相关导航