Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

4个月前发布 104 00

Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示，能捕捉图像的不同层次和方面的视觉特征，适应多样的下游任务。Florence-VL引进深度-广度融合（DBFusion）技术，将不同深度和多个提示下提取的视觉特征，实...

收录时间：

2025-12-16

打开网站手机查看

Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示，能捕捉图像的不同层次和方面的视觉特征，适应多样的下游任务。Florence-VL引进深度-广度融合（DBFusion）技术，将不同深度和多个提示下提取的视觉特征，实现视觉与语言理解的深度融合。

官网：https://github.com/JiuhaiChen/Florence-VL

立即打开官网

数据统计

相关导航

DeepRAG – 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新...

Skywork R1V – 昆仑万维开源的多模态思维链推理模型

Skywork R1V是昆仑万维开源的首款工业界多模态思维链...

Seer – 上海 AI Lab 联合北大等机构推出的端到端操作模型

Seer是由上海AI实验室、北京大学计算机科学与技术学院、北...

Jodi – 中国科学院推出的视觉理解与生成统一模型

Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散...

Nemotron-CC – 英伟达推出的大型预训练数据集

Nemotron-CC是NVIDIA团队推出的大型预训练数据...

LHM – 阿里通义开源的单图生成可动画3D人体模型

LHM（Large Animatable Human Rec...

Eko – Fellou AI 推出的开源 AI 代理开发框架

Eko是Fellou AI推出的生产就绪型JavaScrip...

Ivy-VL – AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型

Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯...