Time-R1 – 基于3B参数模型的时间推理语言模型

4个月前发布 116 00

Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型，通过独特的三阶段强化学习训练方法，在时间推理能力上取得了显著突破。第一阶段“理解”，模型在时间戳推断、时间差估计等基础任务上建立基础；第二阶段“预测”，模型学习预测未来事件的具体时间；第三阶段“生成”，模型生成合理未来场景。模型采用动态奖励机制，逐步掌握复杂时间推理...

收录时间：

2025-12-16

打开网站手机查看

Time-R1 – 基于3B参数模型的时间推理语言模型

Time-R1 – 基于3B参数模型的时间推理语言模型

Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型，通过独特的三阶段强化学习训练方法，在时间推理能力上取得了显著突破。第一阶段“理解”，模型在时间戳推断、时间差估计等基础任务上建立基础；第二阶段“预测”，模型学习预测未来事件的具体时间；第三阶段“生成”，模型生成合理未来场景。模型采用动态奖励机制，逐步掌握复杂时间推理能力。Time-R1在时间推理任务中表现优异，如在时间戳推断任务中优于参数量大10倍的模型，在未来事件时间预测中取得最高分。

官网：https://github.com/ulab-uiuc/Time-R1/tree/master

立即打开官网

数据统计

相关导航

MagicMan – 腾讯联合多所高校推出2D图像生成3D人类模型的AI项目

MagicMan 是清华大学深圳国际研究生院、腾讯AI实验室...

DeepSeek-R1 – DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

DeepSeek-R1是杭州深度求索公司 DeepSeek ...

Leffa – Meta 开源的图像生成框架，精确控制人物的外观和姿势

Leffa（Learning Flow Fields in ...

T2I-R1 – 港中文联合上海AI Lab推出文生图模型

T2I-R1 是香港中文大学和上海AI Lab联合推出的新型...

Kimina-Prover – 月之暗面联合 Numina 推出的数学定理证明模型

Kimina-Prover是月之暗面与Numina团队合作推...

OpenR – 伦敦大学联合多所高校推出提升大模型推理能力的框架

OpenR是一个由伦敦大学学院（UCL）、上海交通大学、利物...

LongReward – 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

LongReward是清华大学、中国科学院、智谱AI联合推出...

Finedefics – 北大团队推出的细粒度多模态大模型

Finedefics 是北京大学彭宇新教授团队推出的细粒度多...