OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架
OThink-MR1是OPPO研究院和香港科技大学(广州)联...
Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构,通过在金融推理场景的高质量思维链数据上进行SFT和RL两阶段训练,有效提升金融复杂推理能力。在权威评测中,Fin-R1平均得分75.2分,与行业标杆 DeepSeek-R1 仅差3分,位居榜单第二。数据构建融合了多个金融领域的高质量数据集,通过数据蒸馏构建了约60k条高质量COT数据集。