MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力

1个月前发布 31 00

MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像和文本,形成了图文交错的多视觉场景。问题分为选择题、填空题和多步问答题三种类型,覆盖了11个数学领域,包括解析几何、代数、度量几何、组合学、变换几何、逻辑、立体几...

收录时间:
2025-12-16
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力

MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像和文本,形成了图文交错的多视觉场景。问题分为选择题、填空题和多步问答题三种类型,覆盖了11个数学领域,包括解析几何、代数、度量几何、组合学、变换几何、逻辑、立体几何、算术、组合几何、描述性几何和统计学,分为三个难度级别。

官网:https://github.com/eternal8080/MV-MATH


立即打开官网

数据统计

相关导航