Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构
Mogao是字节跳动Seed团队推出的交错多模态生成全基础模...
ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统,基于大型语言模型(LLM)自动创建与用户文本提示相匹配的工作流,提升图像生成的质量。系统解决传统单体模型在生成图像时存在的限制,结合多个专业组件如微调基础模型、LoRAs、嵌入、超分辨率步骤等构建复杂的工作流。ComfyGen提出两种基于LLM的方法:一种是基于用户偏好数据的调优方法,另一种是无需训练、直接选择现有流程的方法。两种方法显示出比传统模型或通用工作流更高的图像质量。