FlagevalMM – 智源开源的多模态模型评测框架

1个月前发布 43 00

FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框架采用评测与模型推理解耦的设计,统一视觉语言模型、文生图、文生视频和图文检索等多种模型的评测流程,提升评测效率,便于快速适配新任务和模型。官网:https://github.com/flageval...

收录时间:
2025-12-16
FlagevalMM – 智源开源的多模态模型评测框架FlagevalMM – 智源开源的多模态模型评测框架

FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框架采用评测与模型推理解耦的设计,统一视觉语言模型、文生图、文生视频和图文检索等多种模型的评测流程,提升评测效率,便于快速适配新任务和模型。

官网:https://github.com/flageval-baai/FlagEvalMM


立即打开官网

数据统计

相关导航