MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力

4个月前发布 107 00

MV-MATH 是中科院自动化所提出的新基准数据集，评估多模态大语言模型（MLLMs）在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题，每个问题都结合了多个图像和文本，形成了图文交错的多视觉场景。问题分为选择题、填空题和多步问答题三种类型，覆盖了11个数学领域，包括解析几何、代数、度量几何、组合学、变换几何、逻辑、立体几...

收录时间：

2025-12-16

打开网站手机查看

$MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力$ MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力

MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力

MV-MATH 是中科院自动化所提出的新基准数据集，评估多模态大语言模型（MLLMs）在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题，每个问题都结合了多个图像和文本，形成了图文交错的多视觉场景。问题分为选择题、填空题和多步问答题三种类型，覆盖了11个数学领域，包括解析几何、代数、度量几何、组合学、变换几何、逻辑、立体几何、算术、组合几何、描述性几何和统计学，分为三个难度级别。

官网：https://github.com/eternal8080/MV-MATH

立即打开官网

数据统计

相关导航

Time-MoE – 基于MoE架构的时间序列基础模型

Time-MoE是创新的时间序列基础模型，基于混合专家（Mi...

ComfyUI-Copilot – 阿里推出基于 ComfyUI 的 AI 智能助手

ComfyUI-Copilot 是阿里巴巴国际数字商业集团...

Graphiti – 开源AI动态知识图谱生成框架

Graphiti 是为动态环境设计的 AI 知识图谱生成框架...

CursorCore – 程序员的AI编程辅助框架，对话形式交互理解上下文

CursorCore是一个基于大型语言模型（LLMs）的编程...

Open Computer Agent – Hugging Face 推出的免费云端 AI Agent 工具

Open Computer Agent 是 Hugging ...

VRAG-RL – 阿里通义推出的多模态RAG推理框架

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多...

Aide – 免费开源的AI 编程插件

Aide 是免费开源的AI 编程插件，具备代码注释、语言转换...

SwiftBrush V2 – 文本到图像的单步扩散模型，性能与多步模型相媲美

SwiftBrush V2 是文本到图像的单步扩散模型，通过...