LongCite – 清华推出的开源模型，提升LLMs的精准引用减少幻觉

4个月前发布 134 00

LongCite是由清华大学推出的项目，旨在提升大型语言模型（LLMs）在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用，使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集，以及基于该数据集训练的LongCite-8B和Long...

收录时间：

2025-12-16

打开网站手机查看

LongCite – 清华推出的开源模型，提升LLMs的精准引用减少幻觉

LongCite – 清华推出的开源模型，提升LLMs的精准引用减少幻觉

LongCite是由清华大学推出的项目，旨在提升大型语言模型（LLMs）在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用，使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集，以及基于该数据集训练的LongCite-8B和LongCite-9B模型。模型能理解长文本内容并提供准确的问答服务，同时附上直接查阅的文本引用，增强信息的透明度和可靠性。

官网：https://github.com/THUDM/LongCite

立即打开官网

数据统计

相关导航

Evolving Agents – 开源的AI Agent管理与进化框架

Evolving Agents 是用在创建、管理和进化 AI...

HMoE – 腾讯混元团队提出的新型神经网络架构

HMoE（混合异构专家模型）是腾讯混元团队提出的新型神经网络...

MiLoRA – 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

MiLoRA是参数高效的大型语言模型（LLMs）微调方法，通...

OpenHands – AI编程工具，多智能体协作实现代码编写、命令运行等

OpenHands是 AI编程工具，支持多智能体协作提高开...

ChatMCP – AI 聊天客户端，基于 MCP 支持多语言和自动化安装

ChatMCP 是基于模型上下文协议（MCP）的 AI 聊天...

FLUX-Text – 阿里推出的多语言场景文本编辑框架

FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架...

COMET – 字节开源的通信优化系统

COMET是字节跳动推出的针对Mixture-of-Expe...

GPT Pilot – AI编程工具，让95%的开发者实现自动写代码

GPT Pilot 是一款 AI编程工具，通过模仿人类开发...