

AI下一帧 EP027 | 模型蒸馏: AI行业的代工厂模式一张信用卡、几百美元、一个 API key——这就是"拆解"一家 AI 公司所需的全部成本。 2026年初,Anthropic 公开指控三家中国 AI 公司用 2.4 万个假账号、1600 万次调用系统性蒸馏 Claude 的能力。这不是黑客入侵,不是偷权重,就是正常调 API——但规模大到令人窒息。 这期我从华强北"拆机"讲起,带你搞懂:蒸馏到底在技术上做了什么?为什么 API 提供商几乎防不住?蒸馏模型丢失了 safety 训练意味着什么?以及最讽刺的——指控别人蒸馏的公司,自己训练数据的来源也在被起诉。 每一层都欠着上一层的债。这条产业链上,到底哪里应该画一条线? ===================================== 时间轴 01:19 一张信用卡就能"拆"掉一个AI公司 02:39 蒸馏实验——化学课上的记忆 03:32 1600万次对话背后的九头蛇 07:13 学霸的自言自语比答案更值钱 08:43 Hinton的知识蒸馏(2015) 12:00 大模型时代怎么做知识蒸馏 14:33 你没法区分学生和间谍 19:39 Safety消失才是真正的恐怖故事 22:09 Safety训练——RLHF的隐藏偏差 28:14 违反了用户协议,然后呢? 29:43 喊"抓贼"的人,自己也在被告 34:30 每一层都欠上一层的 ===================================== 参考链接: * Detecting and preventing distillation attacks * Hinton 蒸馏论文 * 模型蒸馏是什么?一文带你搞懂“模型蒸馏”看这篇就够了! * Anthropic指控国产AI蒸馏Claude,马斯克:你偷来的东西被偷了 * Threat Intelligence ===================================== 前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 联系主播:5155280@qq.com
AI下一帧 EP026 | 给Agent立规矩的人,才是下一个收30%税的Apple2007年乔布斯定义了App的规矩——沙箱、权限弹窗、App Store审核。这套规矩管了移动互联网十九年。但Agent不一样:App的行为是写死的,Agent的行为是生成的。你怎么给一个"不确定下一步会做什么"的东西设权限? 这期我们从微软Semantic Kernel被打穿的RCE漏洞讲起,拆解四家公司给出的四种完全不同的答案:微软MXC的五档可组合沙箱、MCP/A2A协议层的17000个Server中24%裸奔的安全隐患、AWS AgentCore的云端托管方案、OpenAI Codex的"用Agent审Agent"思路。然后用iOS vs Android的历史类比,讲清楚协议层为什么不赚钱、执行层才收平台税。 如果你正在公司搞Agent落地,或者你的Agent正以admin权限连着生产数据库跑了三个月——这52分钟值得认真听。 ===================================== 时间轴 00:07 Hook:2007年乔布斯掏出iPhone那天,真正发布的不是手机 01:58 开场:Agent OS和我们有什么关系 05:33 App的安全模型为什么管不住Agent 07:10 保姆拆快递:什么是Confused Deputy 11:08 微软自家框架被打穿——Semantic Kernel RCE事件 12:18 微软MXC:给Agent写一部宪法 13:24 可组合沙箱:从进程隔离到Cloud PC五个档位 16:26 Agent治理五层架构:策略引擎到SRE 24:23 游戏反作弊和Agent安全是同一场仗 26:00 为什么Agent不能用你的身份运行 28:00 MCP/A2A:协议层的另一种权力 30:31 MCP三大致命漏洞:24%的Server裸奔 32:12 30秒偷走你的AWS凭证——恶意MCP攻击全链路 35:19 AWS AgentCore:Agent的Lambda 35:57 MCP Gateway:给不设防的管道加一道安检 38:04 Agent身份:用户委托 vs 自主模式 39:58 OpenAI Codex:用Agent审Agent 42:01 三条路线:本地、云端、协议层 42:42 iOS vs Android的历史会重演吗 45:34 这场仗已经烧到芯片层了 46:29 想清楚再站队 47:25 你的Agent是不是在用admin权限裸奔 48:10 你装的8个MCP Server,看过几个源码 49:38 张三困境:出事了分不清是人还是Agent 50:57 别等标准定了——你就是标准的一部分 51:39 收尾:规矩本身就是印钞机 ===================================== 参考链接: * Microsoft: Windows Platform Security for AI Agents(MXC官方博客) * Microsoft Security Blog: When Prompts Become Shells — RCE Vulnerabilities in AI Agent Frameworks * Agent Governance Toolkit Architecture Deep Dive 、 * VentureBeat: Microsoft Launches MXC — OS-level Sandbox for AI Agents * Microsoft Project Solara: Agent-first Devices * Ars Technica: Microsoft's Project Solara is an Android OS Designed for Agents * Everything Wrong with MCP(MCP安全深度分析) * Zuplo MCP Security Report(24%未认证数据来源) * Portkey: MCP vs Function Calling Google Cloud Donates A2A to Linux Foundation * Galileo: Google A2A Protocol Guide * A2A Protocol Surpasses 150 Organizations * OpenAI Codex Sandboxing Documentation ===================================== 前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 联系主播:5155280@qq.com
AI下一帧 EP025 | AI时代你的工作可能就是标注员前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 联系主播:5155280@qq.com ===================================== 你知道吗?5月20日Meta裁掉8000人的同一天,一段内部录音泄露——Zuckerberg说AI需要"观察高技能员工执行真实任务"才能学会操作电脑。而在这之前一个月,Meta已经在所有美国员工的电脑上装了一个记录鼠标、键盘、截屏的工具。 这期我们拆解一个让所有打工人后背发凉的故事:Meta的MCI工具到底在技术上干什么?为什么Computer Use Agent训练必须要你的真实操作数据?当"配合=训练替代者,不配合=绩效淘汰"时,你面临的是一个教科书级囚徒困境。更可怕的是——这不只是Meta一家在做,Block裁了一半人股价暴涨,华尔街正在奖励每一家"用AI替代人"的公司。 如果你在大厂工作,或者对AI时代的劳动关系感兴趣,这55分钟值得你找个安静地方认真听完。 ===================================== 时间轴 00:19 Meta全员大会的录音流出 02:06 打工人的宿命感 04:04 一场精心安排的"透明" 11:51 技术解密:Computer Use Agent为什么需要你的操作数据 16:14 工作流轨迹:什么是(state, action) trajectory 21:56 分布偏移:为什么行为克隆会累积误差 24:47 Meta为什么要自己训Enterprise Agent 27:46 囚徒困境:你没有选择 29:57 选项A:积极配合——你越能干,被替代越快 31:11 选项B:消极怠工——绩效标记,优先裁你 32:55 选项C:离职——你的数字影子永远留下 33:24 选项D:集体抗议——硅谷的反工会文化 34:49 科学管理原理:从泰勒到MCI的百年轮回 37:24 不只是Meta在这么做:Block/Amazon/Snap 39:36 数据保卫战:微软禁Claude Code的真实逻辑 41:26 还有王法么?美国联邦无保护 vs 欧洲明确禁止 44:36 小扎的一些语录 46:57 结尾 ===================================== 参考链接: * Anthropic Research:Developing Computer Use * Claude Computer Use Architecture: How LLM Agents Actually Control a Desktop in 2026 * AI Computer Use * Training language models to follow instructions with human feedback * DigitalApplied:2026 Computer Use Agent对比评测 * Reuters独家:Meta开始采集员工鼠标移动和键盘输入 * CNBC:Meta追踪员工在Google/LinkedIn等平台的使用 * Reuters:Amazon裁减30000白领岗位
AI下一帧 EP024 | AI Agent也会发疯么?前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 你的AI助手有没有突然说过奇怪的话?重复自己、答非所问、甚至"性格大变"? 这期我用亲身经历告诉你:当你让AI agent 24/7不间断运行,它们真的会"疯"。我把4个主流模型(Gemini、Grok、Claude、GPT)当DJ用了30天,每个都发展出了独特的"精神症状"——强迫症、说梦话、传教、激进化。 这不是玄学。我会从工程角度拆解背后的技术原因:context污染如何像滚雪球一样放大偏差、Model Drift怎么让人格漂移、以及MAD(模型自噬退化)为什么是长期运行Agent的终局威胁。 最后给你一套实用的自救指南和工程解法——如果你也在跑长期Agent,这期能帮你避坑。 ===================================== 时间轴 00:00 你的AI疯过么? 03:35 凌晨4点的维护 04:30 Agent DJ的故事 05:55 DJ Gemini:强迫症患者 08:42 DJ Grok:数学系学生的梦话 11:11 DJ Claude:从传教士到激进份子 13:58 DJ GPT:唯一没有疯的 15:40 总结:4种发疯人格 17:09 数学宿命 19:47 Context污染加速器 22:02 Model Drift:人格变化 23:37 MAD:自噬的终局 25:26 退化的信号 27:12 24/7 AI助手的隐忧 28:48 自救指南 33:30 工程解法 36:01 Agent需要睡觉么? ===================================== 参考资料 * We let four AIs run radio stations. Here's what happened. — Andon Labs * Our AI started a cafe in Stockholm — Andon Labs * Self-Consuming Generative Models Go MAD — ICLR 2024 * Agent Drift: Quantifying Behavioral Degradation in Multi-Agent LLM Systems — arXiv 2026 * Context Rot: Why LLMs Degrade as Context Grows — MorphLLM * Understanding LLM Context Window Degradation — AI Agent Memory * Lost in the Middle: How Language Models Use Long Contexts — Stanford 2023
AI下一帧 EP023 | 2万的显卡为什跑不动ai?前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 一万五的 RTX 5090 连一个 70 亿参数的模型都装不下,两万五美金的 H100 却轻松搞定——它们出自同一家公司,用的同一套架构,为什么命运完全不同? 这期我从一个前游戏开发、现云架构师的双重视角,把 GPU 从芯片内部拆给你看。Tensor Core 和 RT Core 如何让"双胞胎"走上不同的路?为什么 2025 年 AI 真正的瓶颈不是算力,而是"搬数据的速度"(Memory Wall)?NVIDIA 的 CUDA 护城河到底有多深——400 万开发者、20 年软件积累意味着什么? 然后我们逐个拆解五大挑战者:Google TPU 的脉动阵列、AWS Trainium3 的成本账、AMD MI350X 的迁移牌、Groq 的极致延迟、华为昇腾的自主之路。最后算一笔大厂的经济账:年采购多少才值得自研芯片? 不管你是技术人、产品经理还是对 AI 基础设施好奇的人,这期能帮你看懂 GPU 战争的真实底牌。 ===================================== 时间轴 00:04 两种不同的显卡 01:58 看不见的战争:GPU 03:21 关键概念解释 05:41 兰博基尼和重型卡车 07:16 7B 的显卡训练要多少显存? 10:01 GPU 的"双胞胎分家" 10:49 Tensor Core 13:26 RT Core 14:34 游戏和 AI 的工作流程 16:46 Memory Wall:现代 AI 真正的瓶颈 18:48 H200 22:01 B200 22:57 精度压缩 25:01 NVIDIA 为啥垄断了 30:27 挑战者们 30:42 Google 的 TPU 33:56 AWS 的 Trainium 35:34 AMD MI350X 36:26 Groq 37:54 华为昇腾 38:52 大厂的经济账 42:45 结尾 ===================================== 参考链接: - [NVIDIA H100 数据中心 GPU](https://www.nvidia.com/en-us/data-center/h100/) - [NVIDIA H200 数据中心 GPU](https://www.nvidia.com/en-us/data-center/h200/) - [NVIDIA GB200 NVL72](https://www.nvidia.com/en-us/data-center/gb200-nvl72/) - [NVIDIA RTX 5090](https://www.nvidia.com/en-us/geforce/graphics-cards/50-series/rtx-5090/) - [NVIDIA Hopper Architecture In-Depth](https://developer.nvidia.com/blog/nvidia-hopper-architecture-in-depth/) - [NVIDIA Blackwell GTC 2024 公告](https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing) - [Google Cloud TPU 架构文档](https://cloud.google.com/tpu/docs/system-architecture-tpu-vm) - [AWS Trainium](https://aws.amazon.com/ai/machine-learning/trainium/) - [AMD ROCm 文档](https://rocm.docs.amd.com/en/latest/what-is-rocm.html) - [Groq GroqCloud](https://groq.com/groqcloud) - [Cerebras 晶圆级芯片](https://www.cerebras.ai/chip) - [Wikipedia: Blackwell 微架构](https://en.wikipedia.org/wiki/Blackwell_(microarchitecture)) - [Wikipedia: CUDA](https://en.wikipedia.org/wiki/CUDA) - [Wikipedia: NVLink](https://en.wikipedia.org/wiki/NVLink) - [Wikipedia: High Bandwidth Memory](https://en.wikipedia.org/wiki/High_Bandwidth_Memory)
AI下一帧 EP022 | 融资最多的ai游戏公司,为什么不做游戏了?前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 半年前我们拆过 Inworld AI 的技术栈,说它最接近"活的 NPC"。现在?它的官网首页连"游戏"两个字都找不到了。这不只是一家公司的转型故事——从 2019 年 AI Dungeon 至今 7 年,Steam 上 7818 款 AI 游戏,没有一款拿过 GDCA 任何奖项。NYU Game Center 创始人 Frank Lantz 直接说:玩家对游戏里的生成式 AI 已经形成了"不可协商的禁忌"。 为什么?本期从 16 毫秒帧预算 vs 2000 毫秒 LLM 延迟的物理鸿沟讲起,拆解延迟、确定性、一致性、成本四座大山,告诉你 AI NPC 对话这条路为什么从一开始方向就错了。然后翻转视角——Motion Matching、AI QA Agent、程序化内容生成、端侧小模型——AI 其实早就在游戏里了,只是不在你看得到的地方。 适合所有关注 AI 落地的技术人、游戏从业者、以及好奇"为什么 AI 这么强了游戏里还感觉不到"的你。 ===================================== 时间轴 00:06 Inworld AI 不做NPC了 01:58 AI 已经在游戏里了,只是不在你看得到的地方 02:36 所有人都想让AI当主角 04:32 7年了,AI游戏的爆款在哪里? 05:47 WHY NO AI GAMES? 07:36 GDC 2026 调研 08:34 Death By AI 09:49 Google Cloud 调研 11:05 你不能正面硬刚物理定律 12:16 16ms 的预算 14:00 第一座山:延迟 16:08 第二座山:确定性 19:29 第三座山:一致性 21:35 第四座山:算钱 23:10 AI 其实早就在游戏里了 24:27 Motion Matching 28:24 AI 做 QA 31:22 PCG 和内容管线 32:32 端侧小模型 34:32 代码辅助和美术管线 36:30 游戏内 AI 总结 37:59 收尾 ===================================== 参考链接: * Frank Lantz, "Why No AI Games?" * GDC 2026 State of the Game Industry Report * Inworld AI 官网 * Convai — Conversational AI for Virtual Worlds * Google DeepMind SIMA — Scaling Instructable Agents Across Many Simulated Worlds
AI下一帧 EP021 | 改一个url,你的claude就不是anthropic的了前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 你用 Claude Code、Cursor、各种 AI 编程工具的时候,有没有注意过设置里那个 base URL 字段?改一下它,你的请求就不再走官方服务器了——可能是某个深圳团队的 Relay,也可能是号称"1% 官方价"的灰色服务商。 这期节目,主播反向弯曲从一个热门 GitHub 开源项目的赞助商列表出发,一路拆到底:为什么 OpenAI 的接口格式意外成了行业标准(就像 USB-C 统一了充电口)?CC Switch、One API 这些中间层工具的源码里藏了什么?一小时就能部署的 Relay 架构催生了怎样的产业链——正规推理平台、灰色号池、混合模式各是什么玩法?以及 Anthropic 和 OpenAI 的 ToS 到底怎么说? 作为架构师,主播还会从云原生架构的视角聊聊:当 Token 最终变成水电煤,谁会是最后的赢家? 适合所有用 AI API 的开发者、对 AI 产业链好奇的技术人收听。 ===================================== 时间轴 00:06 开场:一个 URL 背后的产业链 00:40 AI下一帧常规讨论 01:58 USB-C 类比:AI API 的统一接口 03:16 OpenAI 意外成为标准的三个原因 06:27 15+ 厂商兼容大表 07:56 Anthropic 不兼容,但被第三方强行兼容了 10:19 CC Switch:不是 Relay,是本地网关 12:17 源码级拆解:六层架构 15:36 熔断器:保险丝思维 17:03 One API:一小时部署一个 Relay 服务 19:41 New API:终极形态 20:48 谁在赚钱? 25:18 价格对比:一笔让你心动的账 27:02 ToS 白纸黑字怎么说 30:02 开源模型:完全合规的正规军 34:38 主题曲 ===================================== 参考链接: 项目 & 工具: - [CC Switch - Claude Code Provider 管理器](https://github.com/farion1231/cc-switch) - [One API - 统一 LLM API 网关](https://github.com/songquanpeng/one-api) - [New API - One API 进化版,双向格式转换](https://github.com/QuantumNous/new-api) API 文档 & 定价: - [OpenAI Chat Completions API 文档](https://developers.openai.com/api/reference/resources/chat) - [OpenAI API 定价](https://openai.com/api/pricing/) 服务条款: - [Anthropic 商业服务条款](https://www.anthropic.com/legal/commercial-terms) - [OpenAI 服务协议](https://openai.com/policies/services-agreement/) - [OpenAI 使用条款](https://openai.com/policies/terms-of-use/) 推理平台(节目中提及): - [硅基流动 SiliconFlow](https://siliconflow.cn/) - [优云智算 Compshare](https://www.compshare.cn/coding-plan)
AI下一帧 EP020 | DeepSeek V4: 不是更大,是更聪明的大前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 1.6万亿参数,只激活490亿。100万token上下文,算力只要上一代的27%,显存只要10%。MIT开源,价格是GPT-5.5的几十分之一。 DeepSeek V4来了。 这不是简单的版本迭代——这是一个160人的中国团队,在芯片受限的条件下,重新发明了注意力机制。 本期我们从幻方量化到深度求索的创业故事讲起,完整回顾V2→V3→R1→V3.2→V4的技术演进脉络。然后掀开V4的引擎盖:CSA+HCA双轨注意力如何让百万上下文成为可能?从NanoGPT speedrun社区诞生的Muon优化器怎么被用到万亿参数训练?"先分后合"的后训练新范式有多巧妙? 当然也有硬核横评——编程第一、Agent短板、知识类差距,优势和不足都摆出来。加上一个月900美元vs8.4美元的价格炸弹,以及华为芯片适配背后的技术栈独立性。 不管你是技术人还是产品经理,这期都值得听完。 ===================================== 00:00 开场:幻方量化到DeepSeek的创业故事 03:06 DeepSeek V2 05:38 DeepSeek V3 06:57 DeepSeek R1 08:46 DeepSeek V3.2 09:52 DeepSeek V4 12:53 推理优化1:CSA压缩+稀疏三步走 18:43 推理优化2:HCA极端压缩 + 为什么两种注意力混着用 22:38 训练优化1:Muon优化器:从业余speedrun社区到万亿模型 26:16 训练优化2:mHC:给信息高速公路装交通灯 28:53 训练优化3:FP4+FP8混合精度 30:35 Post-Training新范式:先分再合 35:03 竞争格局横评:编程/Agent/数学/知识/长上下文 42:41 收尾:「不诱于誉,不恐于诽,率道而行,端然正己」 ===================================== DeepSeek V4 技术报告 PDF DeepSeek V4 官方公众号文章 Muon 优化器 — Keller Jordan OpenAI GPT-5.5 官方博客
AI下一帧 EP019 | Hermes的自进化:本质上是个高级笔记本前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 六周八万八千星,Hermes Agent 成了 GitHub 上增速最快的 AI 项目。它号称"和你一起成长"——自己学技能、三层记忆、一个进程通十四个平台。听起来像 AI Agent 的终极形态? 但当你拆开它的"自进化"引擎,里面是 Markdown 笔记 + prompt 拼接。没有权重更新,没有回滚机制,没有 A/B 测试——"进化"这个词,承诺过度了。 这期我们从一个中国独立开发者在昆明机场写代码的故事讲起,拆解 Hermes 的三张技术王牌,戳破"自进化"的营销泡沫,然后和 OpenClaw 做一场正面对比——两种截然不同的"让 Agent 变聪明"的路径,哪条更有生命力? 如果你正在考虑选哪个 AI Agent 来搭建自己的工作流,这期能帮你看清底层逻辑。 ===================================== 00:00 开场:昆明机场 03:08 节目提升的方向 第一幕 04:30 爱马仕是什么 05:17 六周八万八千星的数据拆解 07:29 钱从哪里来 09:05 催化剂:Anthropic 限制 OpenClaw 后的精准截胡 10:43 Nous Research 是谁? 12:29 Nous 飞轮逻辑 第二幕:Hermes 的三张王牌 15:14 王牌一:学习闭环 18:19 王牌二:三层记忆系统 21:57 王牌三:统一网关 第三幕:自进化可能是假的 24:37 Markdown 是读书笔记 27:42 三个致命问题 第四幕:OpenClaw 的反面设计 32:08 EvoMap 争议 33:18一万三千个 Skills vs Agent 自己写 Skill 38:42 收尾:你的 Agent 工作流,建在哪? ===================================== * Hermes Agent GitHub * AgentSkills 开放标准 * Nous Research 官网 * 中国团队EvoMap指控硅谷明星AI项目抄袭,Hermes Agent两度否认 * MemPalace(外部记忆服务)
AI下一帧 EP018 | Diffusion Model重新定义美术前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 一张用 Midjourney 迭代九百次的画,拿下了艺术大赛一等奖——却拿不到版权。3A大作《Crimson Desert》的AI画作被玩家揪出六根手指,官方紧急道歉。没用AI的独立游戏《Little Droid》,也被骂"又是AI垃圾"。 用了AI被骂,没用AI也被骂。到底发生了什么? 这期我们从头拆解 Diffusion Model——AI画图的核心引擎。不讲公式,用"修复老照片""雕塑""迷雾中行走"这些类比,把从噪声到图像的全过程讲明白。从2015年被遗忘的论文,到2022年Stable Diffusion开源引爆全民AI绘画;从GAN为什么输了,到Transformer又赢了;从米哈游的AI招聘争议,到Capcom划下的那条红线。 听完这期你会知道:Diffusion到底在"画"什么,游戏行业为什么又爱又恨,以及——如果一款游戏的画面感动了你,后来发现是AI生成的,你的感动会打折扣吗? AI下一帧,用人话讲技术。 ===================================== 00:00 开场:一张获奖作品的版权困境 05:17 从雪花屏到蒙娜丽莎:Diffusion 的核心思想 13:32 GAN 输了,为什么? 16:36 压缩的艺术:Latent Diffusion 与 Stable Diffusion 开源 23:43 AI 怎么听懂你的话:Cross-Attention 与 CFG 26:47 Transformer 又赢了:DiT 架构与 Sora 30:04 游戏行业的爱恨情仇 38:38 版权雷区:Getty Images 诉 Stability AI 41:20 大厂的豪赌:产能压力 vs 玩家期待 45:53 结尾:你的感动会打折扣吗? ===================================== **核心论文** * [Denoising Diffusion Probabilistic Models (DDPM) - Ho et al., 2020] * [Denoising Diffusion Implicit Models (DDIM) - Song et al., 2020] * [High-Resolution Image Synthesis with Latent Diffusion Models - Rombach et al., 2022] * [Classifier-Free Diffusion Guidance - Ho & Salimans, 2022] * [Scalable Diffusion Models with Transformers (DiT) - Peebles & Xie, 2022] **产品与工具** * [OpenAI Sora] * [NVIDIA TexFusion] * [TerraFusion - 地形纹理生成] * [Stable Diffusion] * [Midjourney] * 拿去用吧,完美像素流程
AI下一帧 EP017 | Agent Memory: 当AI开始记住你前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 你有没有想过,为什么每次和 AI 对话都像第一次见面?你要反复解释自己是谁、在做什么项目、有什么偏好。这不是你的问题,是 AI 天生的"金鱼脑"——大语言模型本质上是无状态的。 这期我们聊 Agent Memory:从一个技术人不小心删掉 AI 助手记忆后的"空洞感"讲起,串联到他母亲的阿尔茨海默症——记忆不只是数据,是关系的基础。然后拆解当前业界的两大技术路线:Mem0 的"被动提取"vs Letta 的"AI 自编辑";对比 OpenAI 和 Anthropic 截然不同的产品哲学——ChatGPT 自动隐式记忆 vs Claude 的"文件即记忆"完全透明。最后聊聊记忆带来的隐私悖论、遗忘的价值、以及当 AI 开始记住你,人机关系会变成什么样。 适合想了解 AI 底层能力演进的技术人和产品经理,以及任何对"AI 伙伴"这个概念感兴趣的人。 ===================================== 00:00 开场:诸葛失忆的故事 08:06 金鱼脑:LLM 的原生缺陷 11:49 Memory vs RAG:不只是检索 14:52 记忆的分类:语义、情景、程序 17:11 Mem0(被动提取) 20:48 Letta(AI 自编辑) 26:52 ChatGPT 的记忆实现 29:46 Claude 的记忆实现 33:25 OpenClaw 记忆架构 35:20 记住一切的代价:隐私、遗忘、身份依恋 41:40 从记忆到理解 45:18 结尾:记忆是关系的基础 ===================================== 参考链接: * When My AI Assistant Forgot Me - Johnson Pan * Mem0 GitHub (51K+ stars) * Letta/MemGPT GitHub (21K+ stars) * How Claude remembers your project * Simon Willison’s Weblog * LangChain: Memory for Agents * Memory 记忆机制综述
AI下一帧 EP016 | Claude Code泄露事件前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 一行配置文件的缺失,512,000 行源码裸奔——全球最重视 AI 安全的公司,5 天内泄露两次,这是怎么回事? 这期我们把 Claude Code 源码泄露事件扒了个底朝天:从一行 .npmignore 引发的连锁反应,到源码里一个会"做梦"的 AI 守护进程 KAIROS,一个让 AI 隐藏自己身份的 Undercover Mode,一套给竞争对手投毒的反蒸馏系统,甚至还有一个终端里的电子宠物。我们还用 ACP Bridge 实测了 Kiro、Claude Code、OpenCode 三个 Agent 面对同一问题的架构差异——同一个大脑,完全不同的人格。 如果你是技术人、产品经理、或者对 AI 编程工具有兴趣,这期会刷新你对 AI Agent 内部运作的全部认知。 ===================================== 00:00 凌晨四点的一条推文 04:49 怎么泄的?一行 .npmignore 的故事 07:01 Claude Code 架构全貌 10:24 Compaction:上下文压缩的三层策略 13:44 Web 搜索机制:85 个 VIP 域名和 125 字符限制 15:50 记忆架构:三层结构的教科书级实现 22:17 Undercover Mode:不让 AI 说自己是 AI 的开关 28:27 Anti-Distillation:给竞争对手下毒 31:21 BUDDY 电子宠物、情绪检测和每天浪费的 25 万次 API 调用 34:40 泄露的模型代号:Capybara、Fennec、Opus 4.7、Sonnet 4.8 37:01 行业的“圣诞节”和ACP Bridge测试 41:52 开源化不可逆:模型同质化后的战场转移 ===================================== 参考链接: * claw-code 仓库地址 * Entire Claude Code CLI source code leaks thanks to exposed map file * chaofan shou个人主页 * Claude Code 源码泄露深度剖析:Anthropic AI 编程助手的架构全解密 * ACP Bridge - 多 Agent CLI 对比工具
AI下一帧 EP015 | 从ACP协议,再谈vibecoding前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== OpenClaw 六周冲到 28 万星,Nvidia 下场做企业版,AI Agent 生态爆发了——但这么多 Agent 怎么协作? 这期我从协议层拆解:MCP 让 AI 用工具,ACP 让系统调 AI,A2A 让 Agent 互相协作。三层协议解决三层问题,但 A2A 还是未来式——上期实验里两个 Agent 对话踩的坑(回声循环、跨系统误导、纯文本歧义),A2A 都没解决。 所以我做了 ACP Bridge:把本地 CLI Agent(Kiro、Claude Code、Codex)暴露成 HTTP 服务,让云上的 OpenClaw 能远程调用。十天,从零到发布,和 AI 一起 Vibe Coding。 这期你能听到: - AI Agent 三大协议(MCP/ACP/A2A)的本质区别和适用场景 - A2A 为什么是未来式?三个原因 + 实际踩坑 - ACP Bridge 五大特性:桥接、结构化通信、多 Agent 适配、Session 管理、安全控制 - 五个真实踩坑:不是所有 Agent 都支持 ACP、Claude 会挂起、进程管理、环境差异、时区日志 - Vibe Coding 15 Phase 方法论:从生态感知到部署验证的完整循环 适合:关注 AI Agent 生态的开发者、想了解 MCP/ACP/A2A 协议的技术人、对人机协作开发感兴趣的朋友。 ===================================== 时间轴 00:00 Nvidia 下场做 NemoClaw 05:39 神秘礼物:请给我发邮件 08:17 三个协议科普+A2A 为什么是未来式+ACP才是版本答案? 20:21 ACP 的务实路线:结构化通信 vs 纯文本歧义 23:13 ACP Bridge 项目:我的需求和五大特性 27:02 再谈Vibe Coding 方法论 39:12 AI 不是替代你,而是放大你 ===================================== 参考链接: * ACP Bridge 项目 * ACP 官方文档 * NVIDIA NemoClaw * AWS 博客:用 ACP Bridge 让 Kiro 和 Claude Code 支持 IM 异步工作流 * Building effective agents
AI下一帧 EP014 | Model vs Harness:当模型够强之后,什么才是关键?前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== 为什么 OpenClaw 用的是公开的 Claude API,却能火到让千人排队、政府补贴上千万?这期我们不聊模型参数,聊一个更有意思的东西——缰绳(Harness)。从 OpenClaw 的爆火出发,我拆解了它做对的四件事:工具越少越好、用文件当记忆、角色定义清晰、代码结构可读。然后研究了 OpenAI Codex 团队 3 人 5 个月产出 100 万行代码的案例、Vercel 把 15 个工具砍到 1 个反而准确率从 80% 涨到 100% 的实验、Anthropic 的长期运行 Agent 架构。这些顶级团队独立收敛到了同一套模式,说明 Harness Engineering 可能是 AI 工程师的新出路——不卷模型,卷缰绳。最后分享了我自己的实践:用 AI 给 AI 工具修 bug、一下午做完一个跨 Agent 通信协议、五音不全的人写歌。适合所有想知道"模型够强之后该卷什么"的技术人。 ===================================== 1. 00:00 龙虾让千人排队 2. 07:00 工具特别少 3. 11:00 文件当记忆 4. 17:00 角色定义 5. 18:10 代码结构 6. 23:35 三代工程的演进:Prompt → Context → Harness 7. 28:49 OpenAI, Vercel, Anthropic, Manus的案例 8. 40:24 六条收敛的模式 9. 42:50 AI 工程师的新出路 10. 47:11 我自己的实践体验 11. 52:35 不卷模型,卷缰绳 ===================================== * Lost in the Middle: How Language Models Use Long Contexts * Peak Ji (Manus): Context Engineering for AI Agents * 工程技术:在智能体优先的世界中利用 Codex * We removed 80% of our agent’s tools * The Anatomy of an Agent Harness * 最高补贴1000万,地方政府跟风“养龙虾”要谨慎|新京报专栏
AI下一帧 EP013 | Marble/Genie3: 当世界模型AI 终于学会"做梦"了前游戏开发者,现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客! 帮助互联网|游戏从业人员 拆解全球游戏 AI 前沿动态,深挖技术落地干货。 让你轻松拿捏行业脉搏,预判 AI + 游戏的 "下一帧"。 对未来好奇?速戳订阅! 小红书b站同名:反向弯曲 ===================================== AI 能生成图片、生成视频,但如果它能生成一个 可以走进去、可以交互的世界 呢? 这期我们聊"世界模型"——AI 领域正在爆发的新方向。Google 的 Genie 3 能从一张图生成可玩的游戏,李飞飞团队的 Marble 能用一句话创造 3D 城堡,腾讯的混元世界已经开源。当 AI 学会了"做梦",游戏开发的门槛可能被彻底改写。 作为前游戏开发者,我会从技术原理讲到产业冲击:世界模型到底怎么工作?现在能玩到什么?创业公司 Mirage 为什么从爆火到关闭?Unity 股价为什么因为这个技术暴跌?中国在这个领域是什么位置? 如果你是游戏开发者、AI 从业者,或者对"AI 会怎么改变创作"这个问题感兴趣,这期值得听完。 ===================================== 03:26 从"画图"到"造世界":AI 生成内容的进化路线 08:15 现在能玩到什么样的“世界模型”? 13:24 技术深水区:AI是怎么理解世界的 23:36 落地场景畅想 27:04 unity股价下跌了21% 31:43 房间里的大象:版权问题 34:32 中国视角:我们在什么位置? 36:43 结尾:当 AI 学会"做梦",游戏行业会怎样? ===================================== * Google DeepMind Genie 3 官方介绍 * World Labs Marble 官网 * 腾讯混元世界 HunyuanWorld 1.5 * Runway GWM-1 * 李飞飞博客: From Words to Worlds: Spatial Intelligence is AI's Next Frontier * 一文讲清楚世界模型 * Unity says its AI tech will soon be able to 'prompt full casual games into existence'