Molmo 72B – 开源的多模态AI模型,基于Qwen2-72B模型,超越Llama 3.2
Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个...
ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层(支持 RGBA 格式),图层可以单独编辑、组合或叠加。ART 的核心优势是高效的生成机制和强大的透明度处理能力。采用匿名区域布局,生成模型可以自主决定哪些视觉信息与文本对齐,提供了更大的灵活性。ART 引入逐层区域裁剪机制,显著降低了注意力计算成本,生成速度比全注意力方法快 12 倍以上。支持 50 层以上的多层图像生成,减少了图层之间的冲突。