SepLLM – 基于分隔符压缩加速大语言模型的高效框架

4个月前发布 102 00

SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型（LLM）的高效框架，通过压缩段落信息并消除冗余标记，显著提高了模型的推理速度和计算效率。SepLLM的核心是利用分隔符（如标点符号）对注意力机制的贡献，将段落信息压缩到这些标记中，减少计算负担。SepLLM在处理长序列（如400万标记）时表现出色，保持了低困惑度...

收录时间：

2025-12-16

打开网站手机查看

SepLLM – 基于分隔符压缩加速大语言模型的高效框架

SepLLM – 基于分隔符压缩加速大语言模型的高效框架

SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型（LLM）的高效框架，通过压缩段落信息并消除冗余标记，显著提高了模型的推理速度和计算效率。SepLLM的核心是利用分隔符（如标点符号）对注意力机制的贡献，将段落信息压缩到这些标记中，减少计算负担。SepLLM在处理长序列（如400万标记）时表现出色，保持了低困惑度和高效率。支持多节点分布式训练，集成了多种加速操作（如fused rope和fused layer norm）。

官网：https://github.com/HKUDS/SepLLM

立即打开官网

数据统计

相关导航

Titans – 谷歌推出的新型神经记忆架构

Titans是谷歌推出的新型神经网络架构，能突破Transf...

Arctic – Snowflake开源的企业级AI大模型

Arctic是由云计算巨头Snowflake的AI研究团队开...

DuoAttention – 提高LLMs处理长上下文推理效率的AI框架

DuoAttention是新型的框架，由MIT韩松团队提出...

Resume Matcher – 开源AI简历优化工具，解析简历和职位描述提供改进建议

Resume Matcher 是开源的 AI 简历优化工具...

Proxy Lite – 开源视觉语言模型，支持自动化网页任务

Proxy Lite 是开源的轻量级视觉语言模型（VLM...

UniRig – 清华联合 VAST 开源的通用自动骨骼绑定框架

UniRig是清华大学计算机系和VAST联合推出的创新自动骨...

LongCite – 清华推出的开源模型，提升LLMs的精准引用减少幻觉

LongCite是由清华大学推出的项目，旨在提升大型语言模型...

Mercury Coder – Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder 是 Inception Labs...