Jamba – AI21开源的首个基于Mamba架构的大模型

1个月前发布 33 00

Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构化状态空间模型(SSM)和 传统Transformer 架构,兼具了高质量输出、高吞吐量和低内存占用的优点。该混合结...

收录时间:
2025-12-16
Jamba – AI21开源的首个基于Mamba架构的大模型Jamba – AI21开源的首个基于Mamba架构的大模型