CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型

4个月前发布 131 00

CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理，具备双语（中英文）交互能力，能预测并执行GUI操作，实现自动化任务。在多个GUI操作数据集上取得了领先成绩，模型已开源，推动大模型Agent生态的发展。CogAgent...

收录时间：

2025-12-16

打开网站手机查看

CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型

CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型

CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理，具备双语（中英文）交互能力，能预测并执行GUI操作，实现自动化任务。在多个GUI操作数据集上取得了领先成绩，模型已开源，推动大模型Agent生态的发展。CogAgent-9B可广泛应用于个人电脑、手机、车机等GUI交互场景。

官网：https://github.com/THUDM/CogAgent

立即打开官网

数据统计

相关导航

CodeBuddy – 腾讯云推出的AI编程助手

CodeBuddy 是腾讯云推出的 AI 编程助手，能帮助...

DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸...

OpenMemory MCP – 基于MCP协议的本地AI记忆共享工具

OpenMemory MCP 是mem0推出的基于开放模型上...

HumanRig – 阿里高德推出的3D人形角色自动绑定任务数据集

HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑...

Moonlight-16B-A3B – 月之暗面开源的 MoE 模型

Moonlight-16B-A3B 是 Moonshot A...

Jamba – AI21开源的首个基于Mamba架构的大模型

Jamba是由AI21 Labs推出的首个基于Mamba架构...

Replit Agent – AI初创公司Replit推出的AI编程工具

Replit Agent是AI初创公司Replit推出的 A...

LayerSkip – Meta推出加速大型语言模型推理过程的技术

LayerSkip是一种用在加速大型语言模型（LLMs）推理...