源2.0-M32 – 浪潮信息推出的拥有32个专家的混合专家模型(MoE)

3个月前发布 74 00

源2.0-M32是浪潮信息推出的拥有32个专家的混合专家模型(MoE)。采用创新的”Attention Router”技术，提高了模型选择专家的效率和准确性。模型总参数量达40亿，训练计算消耗只有同样规模密集型模型的1/16。源2.0-M32在代码生成、数学问题解决、科学推理等多个领域展现出卓越的性能，其在ARC-C和MATH基准测试中超...

收录时间：

2025-12-16

打开网站手机查看

源2.0-M32 – 浪潮信息推出的拥有32个专家的混合专家模型(MoE)

源2.0-M32 – 浪潮信息推出的拥有32个专家的混合专家模型(MoE)

源2.0-M32是浪潮信息推出的拥有32个专家的混合专家模型(MoE)。采用创新的”Attention Router”技术，提高了模型选择专家的效率和准确性。模型总参数量达40亿，训练计算消耗只有同样规模密集型模型的1/16。源2.0-M32在代码生成、数学问题解决、科学推理等多个领域展现出卓越的性能，其在ARC-C和MATH基准测试中超越了其他模型。

官网：https://github.com/IEIT-Yuan/Yuan2.0-M32

立即打开官网

数据统计

相关导航

Ugic – 即时设计推出的Figma AI设计插件

Ugic是即时设计推出的Figma AI设计插件，能根据用户...

STranslate – 多功能免费AI翻译工具，支持离线OCR识别

STranslate是专为Windows用户设计的多功能翻译...

MeteoRA – 南大推出高效可扩展的多任务嵌入框架

MeteoRA 是南京大学计算机科学与技术系的研究团队推出的...

HMoE – 腾讯混元团队提出的新型神经网络架构

HMoE（混合异构专家模型）是腾讯混元团队提出的新型神经网络...

GPTEngineer – 文本驱动生成Web网页的开源工具，AI自动写代码

GPTEngineer 是一个基于 AI 技术通过简单的文本...

CLEAR – 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

CLEAR是新加坡国立大学推出新型线性注意力机制，能提升预训...

xLAM – Salesforce开源的AI大模型，专注函数调用功能

xLAM 是 Salesforce 开源的一款大型语言模型...

Cofounder – 全栈AI应用构建器，辅助开发者自动生成完整的应用程序

Cofounder是开源的全栈AI开发代理，能帮助开发者基于...