Qwen2.5-1M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

4个月前发布 109 00

Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个模型。在长上下文任务中表现出色，优于之前的128K版本，特别是在处理超过64K长度的任务时。Qwen2.5-14B-Instruct-1M模型击...

收录时间：

2025-12-16

打开网站手机查看

Qwen2.5-1M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

Qwen2.5-1M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个模型。在长上下文任务中表现出色，优于之前的128K版本，特别是在处理超过64K长度的任务时。Qwen2.5-14B-Instruct-1M模型击败了Qwen2.5-Turbo，在多个数据集上稳定超越GPT-4o-mini。Qwen2.5-1M系列模型在短文本任务上的表现与其128K版本相当，确保了基本能力没有因为增加了长序列处理能力而受到影响。

官网：https://huggingface.co/spaces/Qwen/Qwen2.5-1M-Demo

立即打开官网

数据统计

相关导航

ClotheDreamer – 上海大学联合腾讯等高校推出的3D服装生成技术

ClotheDreamer是上海大学、上海交通大学、复旦大学...

AndroidLab – 清华和北大联合推出系统化评估Android智能代理的框架

AndroidLab是用在训练和系统评估Android自主代...

StochSync – AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

StochSync（Stochastic Diffusion...

Jodi – 中国科学院推出的视觉理解与生成统一模型

Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散...

Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

Math24o 是中文大模型测评基准 SuperCLUE 开...

OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架

OThink-MR1是OPPO研究院和香港科技大学（广州）联...

HK-O1aw – HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

HK-O1aw是香港生成式AI研发中心(HKGAI)旗下AI...

MoE++ – 昆仑万维和北大联合推出的混合专家架构

MoE++是一种新型的混合专家（Mixture-of-Exp...