第九章 claude源码的安全协议

本章深入解析了 Claude Code 如何针对不同世代的模型（如内部代号为 Capybara v8 的 Claude 4.5/4.6 系列）进行精细的行为校准，以及如何通过一套复杂的门控和实验系统管理内部验证与全球发布。

以下是该章节核心内容的总结：

1. @[MODEL LAUNCH] 分布式检查清单

为了应对模型升级时需要更新多处代码（如模型 ID、知识截止日期、行为指令等）的挑战，Claude Code 引入了 @[MODEL LAUNCH] 注解系统。

2. 针对特定模型的“个性缺陷”缓解

每个模型世代都有独特的行为倾向，源码记录了针对 Capybara v8 的四种行为缓解指令：

过度注释（Over-commenting）：建立精细的评论哲学，只在“为什么”不明显时添加注释，避免解释显而易见的代码。
虚假声明（False Claims）：针对该模型较高的虚假声明率（29-30%），要求模型提供准确报告而非防御性报告，既不虚报成功也不过度自我怀疑。
主动性不足：纠正模型倾向于盲从指令而不提出判断的问题，将其定位为“协作者”而非单纯的“执行者”。
彻底性不足：要求模型在无法验证结果时显式承认，而非假装任务已完成。

3. USER_TYPE === 'ant' 编译时门控

这是系统实现内部 A/B 测试和安全保护的核心机制。

死代码消除（DCE）：通过打包工具在编译时将 process.env.USER_TYPE 替换为常量，外部构建中物理上不存在任何内部代码（如内部代号或未公开的缓解措施）。
渐进式管道：新功能先在内部（ant）用户中验证，收集数据后再通过 A/B 测试推广至外部。

4. Undercover 模式：公开仓库的隐身术

为了防止 Anthropic 内部工程师在向开源仓库贡献代码时泄露内部信息，系统设计了 Undercover 模式。

5. GrowthBook 与 tengu_* Feature Flag 体系

Claude Code 使用 GrowthBook 作为其远程控制平面。

缓存感知读取：为了不阻塞启动 UI，特性值优先从磁盘或内存缓存读取（_CACHED_MAY_BE_STALE），实现性能与功能的平衡。
模型热切换：通过 tengu_ant_model_override Flag，工程师可以在不发布新版本的情况下，远程配置内部模型列表、调整默认模型或追加系统提示词后缀。

6. 工程启示：从软件到平台

本章提炼了几个关键的 AI Agent 构建原则：

总结而言：第7章展示了如何通过分布式注解、编译时死代码消除、自动化隐私保护和远程实验平台，构建一个能够安全、快速迭代且对不同模型能力具有高度适应性的生产级 AI Agent。