VMix – 字节联合中科大推出增强模型生成美学质量的适配器
VMix是创新的即插即用美学适配器,提升文本到图像扩散模型生...
MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的 图像生成 。MCA-Ctrl引入两种注意力控制策略,Self-Attention Global Injection(SAGI)和Self-Attention Local Query(SALQ),及一个主体定位模块(SLM),解决背景不一致、主体混淆等问题。MCA-Ctrl在零样本图像定制方面优于现有方法,能有效保持主体特征和条件信息的一致性。