DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型

4个月前发布 144 00

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型，包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型（如 DeepSeek-R1 ）的推理能力迁移到较小的模型中，实现更高的计算效率和更低的资源消耗。DistilQwen2.5-R1适用于需要高效计算和快...

收录时间：

2025-12-16

打开网站手机查看

DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型，包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型（如 DeepSeek-R1 ）的推理能力迁移到较小的模型中，实现更高的计算效率和更低的资源消耗。DistilQwen2.5-R1适用于需要高效计算和快速响应的应用场景，例如智能客服、文本生成、机器翻译等。DistilQwen2.5-R1 的发布展示了知识蒸馏在提升小模型性能方面的潜力，为语言模型的优化和应用提供新的方向。

官网：https://huggingface.co/alibaba-pai/DistilQwen2.5-R1-3B

立即打开官网

数据统计

相关导航

Awesome MCP Servers – 开源的MCP资源聚合平台，覆盖多个垂直领域

Awesome MCP Servers 是开源项目，汇集各种...

Chatlog – 开源AI聊天记录分析工具，自动解析、可视化和挖掘聊天记录

Chatlog是开源的聊天记录分析工具，支持高效解析、可视化...

CogView3 – 智谱AI推出的开源AI图像生成模型

CogView3是清华大学联合智谱AI推出的开源 AI图像生...

Browser Use – AI 浏览器助手，自动执行网页中的交互任务

Browser Use是专门为大语言模型服务的智能浏览器工具...

MME-CoT – 港中文等机构推出评估视觉推理能力的基准框架

MME-CoT 是香港中文大学（深圳）、香港中文大学、字节跳...

Laminar – 分析与优化LLM应用程序的开源平台

Laminar是一个开源的可观测性和分析平台，专为大型语言模...

OWL – 开源多智能体协作系统，动态交互实现任务自动化

OWL（Optimized Workforce Learni...

CodeDPO – 北京大学联合字节共同推出的代码生成优化框架

CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架...