VMix – 字节联合中科大推出增强模型生成美学质量的适配器
VMix是创新的即插即用美学适配器,提升文本到图像扩散模型生...
FakeShield是北京大学研究人员推出的多模态大型语言模型框架,能检测和定位图像伪造。框架能评估图像的真实性,生成被篡改区域的掩码,提供基于像素级和图像级篡改线索的判断依据。FakeShield用GPT-4o增强现有数据集,创建多模态篡改描述数据集(MMTDSet),用在训练篡改分析能力。FakeShield包含两个关键模块:领域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM),分别负责检测和定位任务。FakeShield在多种篡改技术如Photoshop、DeepFake和AIGC编辑的检测和定位上表现出色,提供可解释且优于传统方法的解决方案。