SPAR – 智谱团队推出的自我博弈训练框架

4个月前发布 142 00

SPAR是智谱团队推出的自我博弈框架，能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动，生成者执行指令生成回复，完善者对回复进行分析和改进。SPAR基于树搜索技术精细化和优化回复，排除无关的干扰因素，从而突出对指令遵循至关重要的关键差异。这一过程提升了模型执行指令的准确性，增强了模型的自我完善能力。实验...

收录时间：

2025-12-16

打开网站手机查看

SPAR – 智谱团队推出的自我博弈训练框架

SPAR – 智谱团队推出的自我博弈训练框架

SPAR是智谱团队推出的自我博弈框架，能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动，生成者执行指令生成回复，完善者对回复进行分析和改进。SPAR基于树搜索技术精细化和优化回复，排除无关的干扰因素，从而突出对指令遵循至关重要的关键差异。这一过程提升了模型执行指令的准确性，增强了模型的自我完善能力。实验结果显示，SPAR框架能显著提高模型在IFEval等评估基准上的性能，证明在提升大型语言模型指令遵循能力方面的有效性。

官网：https://github.com/thu-coai/SPaR

立即打开官网

数据统计

相关导航

SFR-RAG – 专注于上下文理解和检索增强生成的语言模型

SFR-RAG是由Salesforce AI Researc...

DynaSaur – Adobe 推出的大语言模型代理框架

DynaSaur是Adobe Research推出的大型语言...

Search-o1 – 人大联合清华推出自主知识检索增强的推理框架

Search-o1是中国人民大学和清华大学推出的创新框架，能...

SynthLight – 耶鲁大学联合 Adobe 推出的人像重照明技术

SynthLight 是耶鲁大学和 Adobe Resear...

LBM – AI图像转换框架，实现可控阴影生成

LBM（Latent Bridge Matching）是Ja...

DeerFlow – 字节跳动开源的深度研究框架

DeerFlow 是字节跳动开源的深度研究框架，能帮助用户高...

BFS-Prover – 字节豆包推出的自动定理证明系统

BFS-Prover 是字节跳动豆包大模型团队推出的基于...

Open Deep Research – Deep Research开源复现版智能体，支持切换多种语言模型

Open Deep Research 是开源的 AI 智能体...