Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版

1个月前发布 27 00

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是 Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存需求的同时,保持了高质量的性能。 Gemma 3 27B 的显存需求从 54GB 降低到 14.1GB,能够在消费级 GPU(如 NV...

收录时间:
2025-12-16
Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是 Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存需求的同时,保持了高质量的性能。 Gemma 3 27B 的显存需求从 54GB 降低到 14.1GB,能够在消费级 GPU(如 NVIDIA RTX 3090)上本地运行。Gemma 3 12B 的显存需求从 24GB 降至 6.6GB,可以在笔记本电脑的 NVIDIA RTX 4060 GPU 上高效运行。使更多用户能在普通硬件上体验强大的 AI 功能。

官网:https://developers.googleblog.com/en/gemma-3-quantized-aware-trained-state-of-the-art-ai-to-consumer-gpus/


立即打开官网

数据统计

相关导航