FlagevalMM – 智源开源的多模态模型评测框架

4个月前发布 148 00

FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架，能全面评估处理文本、图像、视频等多种模态的模型，支持多种任务和指标。框架采用评测与模型推理解耦的设计，统一视觉语言模型、文生图、文生视频和图文检索等多种模型的评测流程，提升评测效率，便于快速适配新任务和模型。官网：https://github.com/flageval...

收录时间：

2025-12-16

打开网站手机查看

FlagevalMM – 智源开源的多模态模型评测框架

FlagevalMM – 智源开源的多模态模型评测框架

FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架，能全面评估处理文本、图像、视频等多种模态的模型，支持多种任务和指标。框架采用评测与模型推理解耦的设计，统一视觉语言模型、文生图、文生视频和图文检索等多种模型的评测流程，提升评测效率，便于快速适配新任务和模型。

官网：https://github.com/flageval-baai/FlagEvalMM

立即打开官网

数据统计

相关导航

X-AnyLabeling – AI图像标注工具，支持图像和视频多样化标注样式

X-AnyLabeling是集成多种深度学习算法的图像标注软...

HunyuanVideo – 腾讯推出的开源视频生成模型，参数高达130亿

HunyuanVideo是腾讯开源的视频生成模型，拥有130...

FocuSee – 屏幕录制AI工具，自动跟踪鼠标智能运镜

FocuSee是AI驱动的屏幕录制工具，支持在macOS和W...

KuaiMod – 快手推出的自动化短视频质量判别框架

KuaiMod 是快手推出的基于多模态大模型的短视频质量判别...

Qwen2.5-Omni-3B – 阿里 Qwen 团队推出的轻量级多模态 AI 模型

Qwen2.5-Omni-3B 是阿里巴巴 Qwen 团队推...

MDM – 苹果推出开源的新型扩散模型框架

Matryoshka Diffusion Models（MD...

UniReal – 港大联合 Adobe 推出的通用图像生成和编辑框架

UniReal是香港大学和Adobe研究院共同推出的框架，专...

Seaweed-7B – 字节推出的视频生成模型

Seaweed-7B 是字节跳动团队推出的视频生成模型...