Time-R1 – 基于3B参数模型的时间推理语言模型

1个月前发布 31 00

Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。第一阶段“理解”,模型在时间戳推断、时间差估计等基础任务上建立基础;第二阶段“预测”,模型学习预测未来事件的具体时间;第三阶段“生成”,模型生成合理未来场景。模型采用动态奖励机制,逐步掌握复杂时间推理...

收录时间:
2025-12-16
Time-R1 – 基于3B参数模型的时间推理语言模型Time-R1 – 基于3B参数模型的时间推理语言模型

Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。第一阶段“理解”,模型在时间戳推断、时间差估计等基础任务上建立基础;第二阶段“预测”,模型学习预测未来事件的具体时间;第三阶段“生成”,模型生成合理未来场景。模型采用动态奖励机制,逐步掌握复杂时间推理能力。Time-R1在时间推理任务中表现优异,如在时间戳推断任务中优于参数量大10倍的模型,在未来事件时间预测中取得最高分。

官网:https://github.com/ulab-uiuc/Time-R1/tree/master


立即打开官网

数据统计

相关导航