Circuit Tracer – Anthropic开源的AI模型内部决策追踪工具

4个月前发布 127 00

Circuit Tracer 是 Anthropic 推出的开源工具，用在研究大型语言模型的内部工作机制。Circuit Tracer 基于生成归因图（attribution graphs）揭示模型在生成特定输出时内部所经历的步骤。归因图能帮助研究人员追踪模型的决策过程、可视化特征之间的关系，测试不同的假设。Circuit Tracer ...

收录时间：

2025-12-16

打开网站手机查看

Circuit Tracer – Anthropic开源的AI模型内部决策追踪工具

Circuit Tracer – Anthropic开源的AI模型内部决策追踪工具

Circuit Tracer 是 Anthropic 推出的开源工具，用在研究大型语言模型的内部工作机制。Circuit Tracer 基于生成归因图（attribution graphs）揭示模型在生成特定输出时内部所经历的步骤。归因图能帮助研究人员追踪模型的决策过程、可视化特征之间的关系，测试不同的假设。Circuit Tracer 支持多种流行的开源模型，如 Gemma 和 Llama ，基于 Neuronpedia 提供交互式可视化界面，方便用户探索和分析模型行为。

官网：https://github.com/safety-research/circuit-tracer

立即打开官网

数据统计

相关导航

OLMo 2 32B – Ai2 推出的最新开源语言模型

OLMo 2 32B 是 Allen Institute f...

MoE++ – 昆仑万维和北大联合推出的混合专家架构

MoE++是一种新型的混合专家（Mixture-of-Exp...

SuperGPQA – 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SuperGPQA 是字节跳动豆包大模型团队联合 M-A...

燕雀光年

燕雀光年是在线 AI LOGO设计工具，帮助用户快速生成高...

GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5

GPT-4o mini 是 OpenAI 最新推出的一款AI...

Qwen2.5-1M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持1...

悦流 – AI陪伴应用，与AI朋友一对一聊天随时响应

悦流是提供AI朋友陪伴的社交应用。用户基于记录日常碎碎念，用...

DMind – 专为Web3领域优化的大模型

DMind是DMind研究机构发布的专为Web3领域优化的大...