LongCite – 清华推出的开源模型,提升LLMs的精准引用减少幻觉

1个月前发布 43 00

LongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和Long...

收录时间:
2025-12-16
LongCite – 清华推出的开源模型,提升LLMs的精准引用减少幻觉LongCite – 清华推出的开源模型,提升LLMs的精准引用减少幻觉

LongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。模型能理解长文本内容并提供准确的问答服务,同时附上直接查阅的文本引用,增强信息的透明度和可靠性。

官网:https://github.com/THUDM/LongCite


立即打开官网

数据统计

相关导航