voc33. 两周连发惊天大泄露，最安全AI的草台班子

🎙️ 本期简介

本期节目深度复盘了标榜全球最安全的顶尖AI巨头Anthropic在短短两周内发生的两次史诗级泄露事件。从低级的网站配置错误到NPM打包失误，51万行核心商业机密代码彻底裸奔。我们不仅带你吃瓜这家顶尖科技公司草台班子般的前端代码，更将深入扒开源码，揭秘其颠覆认知的三层自愈记忆系统、后台自动做梦机制，以及细思极恐的潜行伪装模式，探讨闭源AI巨头暗藏的信任危机与安全隐患。

📍 时间轴

00:00 开场引入：最安全AI巨头Anthropic两周内的两次史诗级泄露

01:26 泄露原因极其低级：NPM打包失误与无权限校验的云存储

04:36 源码深扒一：抛弃RAG，利用纯文本文件构建三层自愈记忆架构

06:31 源码深扒二：颠覆交互逻辑的Kairos守护进程与自动做梦机制

08:01 扒开草台班子底色：长达五千行的单体React组件与二十二层嵌套

09:30 荒诞的内部特权：为了养电子宠物鸭子而硬编码绕过安全审查

11:00 细思极恐的潜行模式：强制AI在开源社区伪装人类开发者的底层指令

12:47 弄巧成拙的防抄袭机制：针对竞争对手的投毒陷阱因开源沦为笑话

14:30 零日漏洞挖掘机：被曝光的Mythos大模型及其全自动赛博攻击能力

17:02 虚假的安全感：过度依赖隐蔽性实现安全的致命盲区

18:30 总结与展望：闭源AI黑盒的信任危机与基础网络安全的警钟

💡 核心金句

"你不能一边说自己有毁灭世界的武器，一边连装武器的仓库门都忘了上锁。"

"未来的攻防不再是人类对抗人类，而是机器速度对抗机器速度。"

"在这个世界上，其他那些还没有发生泄露的大门紧闭的AI巨头们，在他们深不见底的黑盒子里，现在究竟还藏着多少个不可告人的潜行模式？"

🔗 相关资源

提及技术与模型：

Anthropic：标榜全球最安全、最具道德感的顶尖AI巨头公司

Claude Code：Anthropic的核心商业产品，本次泄露的51万行代码主体

Claude Mythos：在首次泄露中曝光的未发布超级大模型，具备全自动零日漏洞挖掘能力

SWE-bench：业界公认难度极高的AI软件工程能力测试基准

专业术语：

NPM (Node Package Manager)：Node.js的包管理器，开发者用来打包和发布代码的工具

Source Map (源码映射)：将压缩或混淆后的代码映射回原始源代码的文件，常用于代码调试

RAG (Retrieval-Augmented Generation)：检索增强生成，当前AI行业解决大模型幻觉的常规方案

Context Entropy (上下文熵)：代指AI在长对话中丢失最初规则和设定，从而产生幻觉的现象

Zero-day Vulnerability (零日漏洞)：被发现后立即被恶意利用的安全漏洞，防守方尚无时间发布补丁

Security through Obscurity (隐蔽式安全)：一种依靠隐藏系统内部运作机制来保障安全的脆弱防守策略