Kandinsky-3 – 开源的文本到图像生成框架,适应多种图像生成任务
Kandinsky-3是基于潜在扩散模型的文本到图像(T2I...
Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及ControlNet引导生成,具备深度估计和线条检测功能,实现更精确的图像控制。Qwen2VL-Flux提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。