TinyR1-Preview – 奇虎360联合北大团队推出的推理模型

1个月前发布 26 00

TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78.1分)逼近原版R1(79.8分),远超70B的Deepseek-R1-Distill-Llama(70.0分)。TinyR...

收录时间:
2025-12-16
TinyR1-Preview – 奇虎360联合北大团队推出的推理模型TinyR1-Preview – 奇虎360联合北大团队推出的推理模型

TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78.1分)逼近原版R1(79.8分),远超70B的Deepseek-R1-Distill-Llama(70.0分)。TinyR1-Preview基于“分治-融合”策略,分别训练数学、编程、科学三大垂直领域模型,借助Mergekit工具实现智能融合,突破性能上限。

官网:https://huggingface.co/qihoo360/TinyR1-32B-Preview


立即打开官网

数据统计

相关导航