通古大模型 – 华南理工大学推出的古籍大语言模型

4个月前发布 158 00

通古大模型是华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练，使用24.1亿古籍语料进行无监督训练，结合400万古籍对话数据进行指令微调。模型采用冗余度感知微调（RAT）技术，有效提升了古籍任务的性能。帮助用户更便捷地理解和翻译古籍文献...

收录时间：

2025-12-16

打开网站手机查看

通古大模型 – 华南理工大学推出的古籍大语言模型

通古大模型 – 华南理工大学推出的古籍大语言模型

通古大模型是华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练，使用24.1亿古籍语料进行无监督训练，结合400万古籍对话数据进行指令微调。模型采用冗余度感知微调（RAT）技术，有效提升了古籍任务的性能。帮助用户更便捷地理解和翻译古籍文献。通过检索增强生成（CCU-RAG）技术，减少知识密集型任务中的幻觉问题，提高生成内容的准确性和可靠性。

官网：https://github.com/SCUT-DLVCLab/TongGu-LLM

立即打开官网

数据统计

相关导航

KaChiKa – AI日语学习应用，自动识别图片内容生成相关日语单词和句子

KaChiKa是创新的AI日语学习应用，专为希望通过生活场景...

Fox-1 – TensorOpera 开源的小语言模型系列

Fox-1是TensorOpera推出的一系列小型语言模型...

Xiaomi MiMo – 小米开源的首个推理大模型

Xiaomi MiMo 是小米开源的首个推理（Reasoni...

PersonaMagic – 高保真人脸定制技术，根据肖像无缝生成新角色

PersonaMagic 是创新的高保真人脸定制技术，通过阶...

DIAMOND – 能模拟虚拟环境的强化学习代理

DIAMOND（DIffusion As a Model O...

稿定AI社区

稿定AI社区是稿定推出的设计Agent和AI创意社区，提供丰...

Remy AI – AI睡眠应用，个性化睡眠分析指导睡眠建议

Remy AI是AI睡眠教练应用程序，专注于用科学方法改善用...

WiseFlow – 开源的AI信息挖掘工具

WiseFlow是开源的AI信息挖掘工具，能从网站、微信公众...