Granite 3.1 – IBM 推出的新版语言模型

1个月前发布 27 00

Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型,总共使用 12 万亿个token进行训练。专家混合MoE模型:稀疏1B和3B MoE 模型,分别具有 400M 和 800M 激活参数,总共使用 10 万亿...

收录时间:
2025-12-16
Granite 3.1 – IBM 推出的新版语言模型Granite 3.1 – IBM 推出的新版语言模型

Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型,总共使用 12 万亿个token进行训练。专家混合MoE模型:稀疏1B和3B MoE 模型,分别具有 400M 和 800M 激活参数,总共使用 10 万亿个token进行训练。Granite 3.1支持128K令牌的上下文长度,能处理复杂的文本和任务。Granite 3.1引入全新的嵌入模型,覆盖12种语言,增强多语言支持。Granite Guardian 3.1模型具备功能调用幻觉检测能力,提升对工具调用的控制和可观察性。

官网:https://github.com/ibm-granite/granite-3.1-language-models


立即打开官网

数据统计

相关导航