AI下一帧

441已订阅

AI下一帧

反向弯曲

单集更新

节目详情

AI下一帧 EP027 | 模型蒸馏: AI行业的代工厂模式
一张信用卡、几百美元、一个 API key——这就是"拆解"一家 AI 公司所需的全部成本。 2026年初，Anthropic 公开指控三家中国 AI 公司用 2.4 万个假账号、1600 万次调用系统性蒸馏 Claude 的能力。这不是黑客入侵，不是偷权重，就是正常调 API——但规模大到令人窒息。这期我从华强北"拆机"讲起，带你搞懂：蒸馏到底在技术上做了什么？为什么 API 提供商几乎防不住？蒸馏模型丢失了 safety 训练意味着什么？以及最讽刺的——指控别人蒸馏的公司，自己训练数据的来源也在被起诉。每一层都欠着上一层的债。这条产业链上，到底哪里应该画一条线？ ===================================== 时间轴 01:19 一张信用卡就能"拆"掉一个AI公司 02:39 蒸馏实验——化学课上的记忆 03:32 1600万次对话背后的九头蛇 07:13 学霸的自言自语比答案更值钱 08:43 Hinton的知识蒸馏（2015） 12:00 大模型时代怎么做知识蒸馏 14:33 你没法区分学生和间谍 19:39 Safety消失才是真正的恐怖故事 22:09 Safety训练——RLHF的隐藏偏差 28:14 违反了用户协议，然后呢？ 29:43 喊"抓贼"的人，自己也在被告 34:30 每一层都欠上一层的 ===================================== 参考链接： * Detecting and preventing distillation attacks * Hinton 蒸馏论文 * 模型蒸馏是什么？一文带你搞懂“模型蒸馏”看这篇就够了！ * Anthropic指控国产AI蒸馏Claude，马斯克：你偷来的东西被偷了 * Threat Intelligence ===================================== 前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲联系主播：5155280@qq.com
40分钟 · 3天前
46
0
AI下一帧 EP026 | 给Agent立规矩的人，才是下一个收30%税的Apple
2007年乔布斯定义了App的规矩——沙箱、权限弹窗、App Store审核。这套规矩管了移动互联网十九年。但Agent不一样：App的行为是写死的，Agent的行为是生成的。你怎么给一个"不确定下一步会做什么"的东西设权限？这期我们从微软Semantic Kernel被打穿的RCE漏洞讲起，拆解四家公司给出的四种完全不同的答案：微软MXC的五档可组合沙箱、MCP/A2A协议层的17000个Server中24%裸奔的安全隐患、AWS AgentCore的云端托管方案、OpenAI Codex的"用Agent审Agent"思路。然后用iOS vs Android的历史类比，讲清楚协议层为什么不赚钱、执行层才收平台税。如果你正在公司搞Agent落地，或者你的Agent正以admin权限连着生产数据库跑了三个月——这52分钟值得认真听。 ===================================== 时间轴 00:07 Hook：2007年乔布斯掏出iPhone那天，真正发布的不是手机 01:58 开场：Agent OS和我们有什么关系 05:33 App的安全模型为什么管不住Agent 07:10 保姆拆快递：什么是Confused Deputy 11:08 微软自家框架被打穿——Semantic Kernel RCE事件 12:18 微软MXC：给Agent写一部宪法 13:24 可组合沙箱：从进程隔离到Cloud PC五个档位 16:26 Agent治理五层架构：策略引擎到SRE 24:23 游戏反作弊和Agent安全是同一场仗 26:00 为什么Agent不能用你的身份运行 28:00 MCP/A2A：协议层的另一种权力 30:31 MCP三大致命漏洞：24%的Server裸奔 32:12 30秒偷走你的AWS凭证——恶意MCP攻击全链路 35:19 AWS AgentCore：Agent的Lambda 35:57 MCP Gateway：给不设防的管道加一道安检 38:04 Agent身份：用户委托 vs 自主模式 39:58 OpenAI Codex：用Agent审Agent 42:01 三条路线：本地、云端、协议层 42:42 iOS vs Android的历史会重演吗 45:34 这场仗已经烧到芯片层了 46:29 想清楚再站队 47:25 你的Agent是不是在用admin权限裸奔 48:10 你装的8个MCP Server，看过几个源码 49:38 张三困境：出事了分不清是人还是Agent 50:57 别等标准定了——你就是标准的一部分 51:39 收尾：规矩本身就是印钞机 ===================================== 参考链接： * Microsoft: Windows Platform Security for AI Agents（MXC官方博客） * Microsoft Security Blog: When Prompts Become Shells — RCE Vulnerabilities in AI Agent Frameworks * Agent Governance Toolkit Architecture Deep Dive 、 * VentureBeat: Microsoft Launches MXC — OS-level Sandbox for AI Agents * Microsoft Project Solara: Agent-first Devices * Ars Technica: Microsoft's Project Solara is an Android OS Designed for Agents * Everything Wrong with MCP（MCP安全深度分析） * Zuplo MCP Security Report（24%未认证数据来源） * Portkey: MCP vs Function Calling Google Cloud Donates A2A to Linux Foundation * Galileo: Google A2A Protocol Guide * A2A Protocol Surpasses 150 Organizations * OpenAI Codex Sandboxing Documentation ===================================== 前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲联系主播：5155280@qq.com
55分钟 · 10天前
86
0
AI下一帧 EP025 | AI时代你的工作可能就是标注员
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲联系主播：5155280@qq.com ===================================== 你知道吗？5月20日Meta裁掉8000人的同一天，一段内部录音泄露——Zuckerberg说AI需要"观察高技能员工执行真实任务"才能学会操作电脑。而在这之前一个月，Meta已经在所有美国员工的电脑上装了一个记录鼠标、键盘、截屏的工具。这期我们拆解一个让所有打工人后背发凉的故事：Meta的MCI工具到底在技术上干什么？为什么Computer Use Agent训练必须要你的真实操作数据？当"配合=训练替代者，不配合=绩效淘汰"时，你面临的是一个教科书级囚徒困境。更可怕的是——这不只是Meta一家在做，Block裁了一半人股价暴涨，华尔街正在奖励每一家"用AI替代人"的公司。如果你在大厂工作，或者对AI时代的劳动关系感兴趣，这55分钟值得你找个安静地方认真听完。 ===================================== 时间轴 00:19 Meta全员大会的录音流出 02:06 打工人的宿命感 04:04 一场精心安排的"透明" 11:51 技术解密：Computer Use Agent为什么需要你的操作数据 16:14 工作流轨迹：什么是(state, action) trajectory 21:56 分布偏移：为什么行为克隆会累积误差 24:47 Meta为什么要自己训Enterprise Agent 27:46 囚徒困境：你没有选择 29:57 选项A：积极配合——你越能干，被替代越快 31:11 选项B：消极怠工——绩效标记，优先裁你 32:55 选项C：离职——你的数字影子永远留下 33:24 选项D：集体抗议——硅谷的反工会文化 34:49 科学管理原理：从泰勒到MCI的百年轮回 37:24 不只是Meta在这么做：Block/Amazon/Snap 39:36 数据保卫战：微软禁Claude Code的真实逻辑 41:26 还有王法么？美国联邦无保护 vs 欧洲明确禁止 44:36 小扎的一些语录 46:57 结尾 ===================================== 参考链接： * Anthropic Research：Developing Computer Use * Claude Computer Use Architecture: How LLM Agents Actually Control a Desktop in 2026 * AI Computer Use * Training language models to follow instructions with human feedback * DigitalApplied：2026 Computer Use Agent对比评测 * Reuters独家：Meta开始采集员工鼠标移动和键盘输入 * CNBC：Meta追踪员工在Google/LinkedIn等平台的使用 * Reuters：Amazon裁减30000白领岗位
52分钟 · 17天前
83
0
AI下一帧 EP024 | AI Agent也会发疯么？
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 你的AI助手有没有突然说过奇怪的话？重复自己、答非所问、甚至"性格大变"？这期我用亲身经历告诉你：当你让AI agent 24/7不间断运行，它们真的会"疯"。我把4个主流模型（Gemini、Grok、Claude、GPT）当DJ用了30天，每个都发展出了独特的"精神症状"——强迫症、说梦话、传教、激进化。这不是玄学。我会从工程角度拆解背后的技术原因：context污染如何像滚雪球一样放大偏差、Model Drift怎么让人格漂移、以及MAD（模型自噬退化）为什么是长期运行Agent的终局威胁。最后给你一套实用的自救指南和工程解法——如果你也在跑长期Agent，这期能帮你避坑。 ===================================== 时间轴 00:00 你的AI疯过么？ 03:35 凌晨4点的维护 04:30 Agent DJ的故事 05:55 DJ Gemini：强迫症患者 08:42 DJ Grok：数学系学生的梦话 11:11 DJ Claude：从传教士到激进份子 13:58 DJ GPT：唯一没有疯的 15:40 总结：4种发疯人格 17:09 数学宿命 19:47 Context污染加速器 22:02 Model Drift：人格变化 23:37 MAD：自噬的终局 25:26 退化的信号 27:12 24/7 AI助手的隐忧 28:48 自救指南 33:30 工程解法 36:01 Agent需要睡觉么？ ===================================== 参考资料 * We let four AIs run radio stations. Here's what happened. — Andon Labs * Our AI started a cafe in Stockholm — Andon Labs * Self-Consuming Generative Models Go MAD — ICLR 2024 * Agent Drift: Quantifying Behavioral Degradation in Multi-Agent LLM Systems — arXiv 2026 * Context Rot: Why LLMs Degrade as Context Grows — MorphLLM * Understanding LLM Context Window Degradation — AI Agent Memory * Lost in the Middle: How Language Models Use Long Contexts — Stanford 2023
41分钟 · 24天前
82
2
AI下一帧 EP023 | 2万的显卡为什跑不动ai?
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 一万五的 RTX 5090 连一个 70 亿参数的模型都装不下，两万五美金的 H100 却轻松搞定——它们出自同一家公司，用的同一套架构，为什么命运完全不同？这期我从一个前游戏开发、现云架构师的双重视角，把 GPU 从芯片内部拆给你看。Tensor Core 和 RT Core 如何让"双胞胎"走上不同的路？为什么 2025 年 AI 真正的瓶颈不是算力，而是"搬数据的速度"（Memory Wall）？NVIDIA 的 CUDA 护城河到底有多深——400 万开发者、20 年软件积累意味着什么？然后我们逐个拆解五大挑战者：Google TPU 的脉动阵列、AWS Trainium3 的成本账、AMD MI350X 的迁移牌、Groq 的极致延迟、华为昇腾的自主之路。最后算一笔大厂的经济账：年采购多少才值得自研芯片？不管你是技术人、产品经理还是对 AI 基础设施好奇的人，这期能帮你看懂 GPU 战争的真实底牌。 ===================================== 时间轴 00:04 两种不同的显卡 01:58 看不见的战争：GPU 03:21 关键概念解释 05:41 兰博基尼和重型卡车 07:16 7B 的显卡训练要多少显存？ 10:01 GPU 的"双胞胎分家" 10:49 Tensor Core 13:26 RT Core 14:34 游戏和 AI 的工作流程 16:46 Memory Wall：现代 AI 真正的瓶颈 18:48 H200 22:01 B200 22:57 精度压缩 25:01 NVIDIA 为啥垄断了 30:27 挑战者们 30:42 Google 的 TPU 33:56 AWS 的 Trainium 35:34 AMD MI350X 36:26 Groq 37:54 华为昇腾 38:52 大厂的经济账 42:45 结尾 ===================================== 参考链接： - [NVIDIA H100 数据中心 GPU](https://www.nvidia.com/en-us/data-center/h100/) - [NVIDIA H200 数据中心 GPU](https://www.nvidia.com/en-us/data-center/h200/) - [NVIDIA GB200 NVL72](https://www.nvidia.com/en-us/data-center/gb200-nvl72/) - [NVIDIA RTX 5090](https://www.nvidia.com/en-us/geforce/graphics-cards/50-series/rtx-5090/) - [NVIDIA Hopper Architecture In-Depth](https://developer.nvidia.com/blog/nvidia-hopper-architecture-in-depth/) - [NVIDIA Blackwell GTC 2024 公告](https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing) - [Google Cloud TPU 架构文档](https://cloud.google.com/tpu/docs/system-architecture-tpu-vm) - [AWS Trainium](https://aws.amazon.com/ai/machine-learning/trainium/) - [AMD ROCm 文档](https://rocm.docs.amd.com/en/latest/what-is-rocm.html) - [Groq GroqCloud](https://groq.com/groqcloud) - [Cerebras 晶圆级芯片](https://www.cerebras.ai/chip) - [Wikipedia: Blackwell 微架构](https://en.wikipedia.org/wiki/Blackwell_(microarchitecture)) - [Wikipedia: CUDA](https://en.wikipedia.org/wiki/CUDA) - [Wikipedia: NVLink](https://en.wikipedia.org/wiki/NVLink) - [Wikipedia: High Bandwidth Memory](https://en.wikipedia.org/wiki/High_Bandwidth_Memory)
46分钟 · 1 个月前
86
0
AI下一帧 EP022 | 融资最多的ai游戏公司，为什么不做游戏了？
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 半年前我们拆过 Inworld AI 的技术栈，说它最接近"活的 NPC"。现在？它的官网首页连"游戏"两个字都找不到了。这不只是一家公司的转型故事——从 2019 年 AI Dungeon 至今 7 年，Steam 上 7818 款 AI 游戏，没有一款拿过 GDCA 任何奖项。NYU Game Center 创始人 Frank Lantz 直接说：玩家对游戏里的生成式 AI 已经形成了"不可协商的禁忌"。为什么？本期从 16 毫秒帧预算 vs 2000 毫秒 LLM 延迟的物理鸿沟讲起，拆解延迟、确定性、一致性、成本四座大山，告诉你 AI NPC 对话这条路为什么从一开始方向就错了。然后翻转视角——Motion Matching、AI QA Agent、程序化内容生成、端侧小模型——AI 其实早就在游戏里了，只是不在你看得到的地方。适合所有关注 AI 落地的技术人、游戏从业者、以及好奇"为什么 AI 这么强了游戏里还感觉不到"的你。 ===================================== 时间轴 00:06 Inworld AI 不做NPC了 01:58 AI 已经在游戏里了，只是不在你看得到的地方 02:36 所有人都想让AI当主角 04:32 7年了，AI游戏的爆款在哪里？ 05:47 WHY NO AI GAMES? 07:36 GDC 2026 调研 08:34 Death By AI 09:49 Google Cloud 调研 11:05 你不能正面硬刚物理定律 12:16 16ms 的预算 14:00 第一座山：延迟 16:08 第二座山：确定性 19:29 第三座山：一致性 21:35 第四座山：算钱 23:10 AI 其实早就在游戏里了 24:27 Motion Matching 28:24 AI 做 QA 31:22 PCG 和内容管线 32:32 端侧小模型 34:32 代码辅助和美术管线 36:30 游戏内 AI 总结 37:59 收尾 ===================================== 参考链接： * Frank Lantz, "Why No AI Games?" * GDC 2026 State of the Game Industry Report * Inworld AI 官网 * Convai — Conversational AI for Virtual Worlds * Google DeepMind SIMA — Scaling Instructable Agents Across Many Simulated Worlds
42分钟 · 1 个月前
69
3
AI下一帧 EP021 | 改一个url，你的claude就不是anthropic的了
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 你用 Claude Code、Cursor、各种 AI 编程工具的时候，有没有注意过设置里那个 base URL 字段？改一下它，你的请求就不再走官方服务器了——可能是某个深圳团队的 Relay，也可能是号称"1% 官方价"的灰色服务商。这期节目，主播反向弯曲从一个热门 GitHub 开源项目的赞助商列表出发，一路拆到底：为什么 OpenAI 的接口格式意外成了行业标准（就像 USB-C 统一了充电口）？CC Switch、One API 这些中间层工具的源码里藏了什么？一小时就能部署的 Relay 架构催生了怎样的产业链——正规推理平台、灰色号池、混合模式各是什么玩法？以及 Anthropic 和 OpenAI 的 ToS 到底怎么说？作为架构师，主播还会从云原生架构的视角聊聊：当 Token 最终变成水电煤，谁会是最后的赢家？适合所有用 AI API 的开发者、对 AI 产业链好奇的技术人收听。 ===================================== 时间轴 00:06 开场：一个 URL 背后的产业链 00:40 AI下一帧常规讨论 01:58 USB-C 类比：AI API 的统一接口 03:16 OpenAI 意外成为标准的三个原因 06:27 15+ 厂商兼容大表 07:56 Anthropic 不兼容，但被第三方强行兼容了 10:19 CC Switch：不是 Relay，是本地网关 12:17 源码级拆解：六层架构 15:36 熔断器：保险丝思维 17:03 One API：一小时部署一个 Relay 服务 19:41 New API：终极形态 20:48 谁在赚钱？ 25:18 价格对比：一笔让你心动的账 27:02 ToS 白纸黑字怎么说 30:02 开源模型：完全合规的正规军 34:38 主题曲 ===================================== 参考链接：项目 & 工具： - [CC Switch - Claude Code Provider 管理器](https://github.com/farion1231/cc-switch) - [One API - 统一 LLM API 网关](https://github.com/songquanpeng/one-api) - [New API - One API 进化版，双向格式转换](https://github.com/QuantumNous/new-api) API 文档 & 定价： - [OpenAI Chat Completions API 文档](https://developers.openai.com/api/reference/resources/chat) - [OpenAI API 定价](https://openai.com/api/pricing/) 服务条款： - [Anthropic 商业服务条款](https://www.anthropic.com/legal/commercial-terms) - [OpenAI 服务协议](https://openai.com/policies/services-agreement/) - [OpenAI 使用条款](https://openai.com/policies/terms-of-use/) 推理平台（节目中提及）： - [硅基流动 SiliconFlow](https://siliconflow.cn/) - [优云智算 Compshare](https://www.compshare.cn/coding-plan)
37分钟 · 1 个月前
102
2
AI下一帧 EP020 | DeepSeek V4: 不是更大，是更聪明的大
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 1.6万亿参数，只激活490亿。100万token上下文，算力只要上一代的27%，显存只要10%。MIT开源，价格是GPT-5.5的几十分之一。 DeepSeek V4来了。这不是简单的版本迭代——这是一个160人的中国团队，在芯片受限的条件下，重新发明了注意力机制。本期我们从幻方量化到深度求索的创业故事讲起，完整回顾V2→V3→R1→V3.2→V4的技术演进脉络。然后掀开V4的引擎盖：CSA+HCA双轨注意力如何让百万上下文成为可能？从NanoGPT speedrun社区诞生的Muon优化器怎么被用到万亿参数训练？"先分后合"的后训练新范式有多巧妙？当然也有硬核横评——编程第一、Agent短板、知识类差距，优势和不足都摆出来。加上一个月900美元vs8.4美元的价格炸弹，以及华为芯片适配背后的技术栈独立性。不管你是技术人还是产品经理，这期都值得听完。 ===================================== 00:00 开场：幻方量化到DeepSeek的创业故事 03:06 DeepSeek V2 05:38 DeepSeek V3 06:57 DeepSeek R1 08:46 DeepSeek V3.2 09:52 DeepSeek V4 12:53 推理优化1：CSA压缩+稀疏三步走 18:43 推理优化2：HCA极端压缩 + 为什么两种注意力混着用 22:38 训练优化1：Muon优化器：从业余speedrun社区到万亿模型 26:16 训练优化2：mHC：给信息高速公路装交通灯 28:53 训练优化3：FP4+FP8混合精度 30:35 Post-Training新范式：先分再合 35:03 竞争格局横评：编程/Agent/数学/知识/长上下文 42:41 收尾：「不诱于誉，不恐于诽，率道而行，端然正己」 ===================================== DeepSeek V4 技术报告 PDF DeepSeek V4 官方公众号文章 Muon 优化器 — Keller Jordan OpenAI GPT-5.5 官方博客
46分钟 · 2个月前
147
2
AI下一帧 EP019 | Hermes的自进化:本质上是个高级笔记本
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 六周八万八千星，Hermes Agent 成了 GitHub 上增速最快的 AI 项目。它号称"和你一起成长"——自己学技能、三层记忆、一个进程通十四个平台。听起来像 AI Agent 的终极形态？但当你拆开它的"自进化"引擎，里面是 Markdown 笔记 + prompt 拼接。没有权重更新，没有回滚机制，没有 A/B 测试——"进化"这个词，承诺过度了。这期我们从一个中国独立开发者在昆明机场写代码的故事讲起，拆解 Hermes 的三张技术王牌，戳破"自进化"的营销泡沫，然后和 OpenClaw 做一场正面对比——两种截然不同的"让 Agent 变聪明"的路径，哪条更有生命力？如果你正在考虑选哪个 AI Agent 来搭建自己的工作流，这期能帮你看清底层逻辑。 ===================================== 00:00 开场：昆明机场 03:08 节目提升的方向第一幕 04:30 爱马仕是什么 05:17 六周八万八千星的数据拆解 07:29 钱从哪里来 09:05 催化剂：Anthropic 限制 OpenClaw 后的精准截胡 10:43 Nous Research 是谁？ 12:29 Nous 飞轮逻辑第二幕：Hermes 的三张王牌 15:14 王牌一：学习闭环 18:19 王牌二：三层记忆系统 21:57 王牌三：统一网关第三幕：自进化可能是假的 24:37 Markdown 是读书笔记 27:42 三个致命问题第四幕：OpenClaw 的反面设计 32:08 EvoMap 争议 33:18一万三千个 Skills vs Agent 自己写 Skill 38:42 收尾：你的 Agent 工作流，建在哪？ ===================================== * Hermes Agent GitHub * AgentSkills 开放标准 * Nous Research 官网 * 中国团队EvoMap指控硅谷明星AI项目抄袭，Hermes Agent两度否认 * MemPalace（外部记忆服务）
43分钟 · 2个月前
247
0
AI下一帧 EP018 | Diffusion Model重新定义美术
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 一张用 Midjourney 迭代九百次的画，拿下了艺术大赛一等奖——却拿不到版权。3A大作《Crimson Desert》的AI画作被玩家揪出六根手指，官方紧急道歉。没用AI的独立游戏《Little Droid》，也被骂"又是AI垃圾"。用了AI被骂，没用AI也被骂。到底发生了什么？这期我们从头拆解 Diffusion Model——AI画图的核心引擎。不讲公式，用"修复老照片""雕塑""迷雾中行走"这些类比，把从噪声到图像的全过程讲明白。从2015年被遗忘的论文，到2022年Stable Diffusion开源引爆全民AI绘画；从GAN为什么输了，到Transformer又赢了；从米哈游的AI招聘争议，到Capcom划下的那条红线。听完这期你会知道：Diffusion到底在"画"什么，游戏行业为什么又爱又恨，以及——如果一款游戏的画面感动了你，后来发现是AI生成的，你的感动会打折扣吗？ AI下一帧，用人话讲技术。 ===================================== 00:00 开场：一张获奖作品的版权困境 05:17 从雪花屏到蒙娜丽莎：Diffusion 的核心思想 13:32 GAN 输了，为什么？ 16:36 压缩的艺术：Latent Diffusion 与 Stable Diffusion 开源 23:43 AI 怎么听懂你的话：Cross-Attention 与 CFG 26:47 Transformer 又赢了：DiT 架构与 Sora 30:04 游戏行业的爱恨情仇 38:38 版权雷区：Getty Images 诉 Stability AI 41:20 大厂的豪赌：产能压力 vs 玩家期待 45:53 结尾：你的感动会打折扣吗？ ===================================== **核心论文** * [Denoising Diffusion Probabilistic Models (DDPM) - Ho et al., 2020] * [Denoising Diffusion Implicit Models (DDIM) - Song et al., 2020] * [High-Resolution Image Synthesis with Latent Diffusion Models - Rombach et al., 2022] * [Classifier-Free Diffusion Guidance - Ho & Salimans, 2022] * [Scalable Diffusion Models with Transformers (DiT) - Peebles & Xie, 2022] **产品与工具** * [OpenAI Sora] * [NVIDIA TexFusion] * [TerraFusion - 地形纹理生成] * [Stable Diffusion] * [Midjourney] * 拿去用吧，完美像素流程
49分钟 · 2个月前
59
0
AI下一帧 EP017 | Agent Memory: 当AI开始记住你
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 你有没有想过，为什么每次和 AI 对话都像第一次见面？你要反复解释自己是谁、在做什么项目、有什么偏好。这不是你的问题，是 AI 天生的"金鱼脑"——大语言模型本质上是无状态的。这期我们聊 Agent Memory：从一个技术人不小心删掉 AI 助手记忆后的"空洞感"讲起，串联到他母亲的阿尔茨海默症——记忆不只是数据，是关系的基础。然后拆解当前业界的两大技术路线：Mem0 的"被动提取"vs Letta 的"AI 自编辑"；对比 OpenAI 和 Anthropic 截然不同的产品哲学——ChatGPT 自动隐式记忆 vs Claude 的"文件即记忆"完全透明。最后聊聊记忆带来的隐私悖论、遗忘的价值、以及当 AI 开始记住你，人机关系会变成什么样。适合想了解 AI 底层能力演进的技术人和产品经理，以及任何对"AI 伙伴"这个概念感兴趣的人。 ===================================== 00:00 开场：诸葛失忆的故事 08:06 金鱼脑：LLM 的原生缺陷 11:49 Memory vs RAG：不只是检索 14:52 记忆的分类：语义、情景、程序 17:11 Mem0（被动提取） 20:48 Letta（AI 自编辑） 26:52 ChatGPT 的记忆实现 29:46 Claude 的记忆实现 33:25 OpenClaw 记忆架构 35:20 记住一切的代价：隐私、遗忘、身份依恋 41:40 从记忆到理解 45:18 结尾：记忆是关系的基础 ===================================== 参考链接： * When My AI Assistant Forgot Me - Johnson Pan * Mem0 GitHub (51K+ stars) * Letta/MemGPT GitHub (21K+ stars) * How Claude remembers your project * Simon Willison’s Weblog * LangChain: Memory for Agents * Memory 记忆机制综述
53分钟 · 2个月前
156
2
AI下一帧 EP016 | Claude Code泄露事件
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 一行配置文件的缺失，512,000 行源码裸奔——全球最重视 AI 安全的公司，5 天内泄露两次，这是怎么回事？这期我们把 Claude Code 源码泄露事件扒了个底朝天：从一行 .npmignore 引发的连锁反应，到源码里一个会"做梦"的 AI 守护进程 KAIROS，一个让 AI 隐藏自己身份的 Undercover Mode，一套给竞争对手投毒的反蒸馏系统，甚至还有一个终端里的电子宠物。我们还用 ACP Bridge 实测了 Kiro、Claude Code、OpenCode 三个 Agent 面对同一问题的架构差异——同一个大脑，完全不同的人格。如果你是技术人、产品经理、或者对 AI 编程工具有兴趣，这期会刷新你对 AI Agent 内部运作的全部认知。 ===================================== 00:00 凌晨四点的一条推文 04:49 怎么泄的？一行 .npmignore 的故事 07:01 Claude Code 架构全貌 10:24 Compaction：上下文压缩的三层策略 13:44 Web 搜索机制：85 个 VIP 域名和 125 字符限制 15:50 记忆架构：三层结构的教科书级实现 22:17 Undercover Mode：不让 AI 说自己是 AI 的开关 28:27 Anti-Distillation：给竞争对手下毒 31:21 BUDDY 电子宠物、情绪检测和每天浪费的 25 万次 API 调用 34:40 泄露的模型代号：Capybara、Fennec、Opus 4.7、Sonnet 4.8 37:01 行业的“圣诞节”和ACP Bridge测试 41:52 开源化不可逆：模型同质化后的战场转移 ===================================== 参考链接： * claw-code 仓库地址 * Entire Claude Code CLI source code leaks thanks to exposed map file * chaofan shou个人主页 * Claude Code 源码泄露深度剖析：Anthropic AI 编程助手的架构全解密 * ACP Bridge - 多 Agent CLI 对比工具
48分钟 · 3个月前
162
2
AI下一帧 EP015 | 从ACP协议，再谈vibecoding
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== OpenClaw 六周冲到 28 万星，Nvidia 下场做企业版，AI Agent 生态爆发了——但这么多 Agent 怎么协作？这期我从协议层拆解：MCP 让 AI 用工具，ACP 让系统调 AI，A2A 让 Agent 互相协作。三层协议解决三层问题，但 A2A 还是未来式——上期实验里两个 Agent 对话踩的坑（回声循环、跨系统误导、纯文本歧义），A2A 都没解决。所以我做了 ACP Bridge：把本地 CLI Agent（Kiro、Claude Code、Codex）暴露成 HTTP 服务，让云上的 OpenClaw 能远程调用。十天，从零到发布，和 AI 一起 Vibe Coding。这期你能听到： - AI Agent 三大协议（MCP/ACP/A2A）的本质区别和适用场景 - A2A 为什么是未来式？三个原因 + 实际踩坑 - ACP Bridge 五大特性：桥接、结构化通信、多 Agent 适配、Session 管理、安全控制 - 五个真实踩坑：不是所有 Agent 都支持 ACP、Claude 会挂起、进程管理、环境差异、时区日志 - Vibe Coding 15 Phase 方法论：从生态感知到部署验证的完整循环适合：关注 AI Agent 生态的开发者、想了解 MCP/ACP/A2A 协议的技术人、对人机协作开发感兴趣的朋友。 ===================================== 时间轴 00:00 Nvidia 下场做 NemoClaw 05:39 神秘礼物：请给我发邮件 08:17 三个协议科普+A2A 为什么是未来式+ACP才是版本答案？ 20:21 ACP 的务实路线：结构化通信 vs 纯文本歧义 23:13 ACP Bridge 项目：我的需求和五大特性 27:02 再谈Vibe Coding 方法论 39:12 AI 不是替代你，而是放大你 ===================================== 参考链接： * ACP Bridge 项目 * ACP 官方文档 * NVIDIA NemoClaw * AWS 博客：用 ACP Bridge 让 Kiro 和 Claude Code 支持 IM 异步工作流 * Building effective agents
44分钟 · 3个月前
116
0
AI下一帧 EP014 | Model vs Harness:当模型够强之后，什么才是关键？
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== 为什么 OpenClaw 用的是公开的 Claude API，却能火到让千人排队、政府补贴上千万？这期我们不聊模型参数，聊一个更有意思的东西——缰绳（Harness）。从 OpenClaw 的爆火出发，我拆解了它做对的四件事：工具越少越好、用文件当记忆、角色定义清晰、代码结构可读。然后研究了 OpenAI Codex 团队 3 人 5 个月产出 100 万行代码的案例、Vercel 把 15 个工具砍到 1 个反而准确率从 80% 涨到 100% 的实验、Anthropic 的长期运行 Agent 架构。这些顶级团队独立收敛到了同一套模式，说明 Harness Engineering 可能是 AI 工程师的新出路——不卷模型，卷缰绳。最后分享了我自己的实践：用 AI 给 AI 工具修 bug、一下午做完一个跨 Agent 通信协议、五音不全的人写歌。适合所有想知道"模型够强之后该卷什么"的技术人。 ===================================== 1. 00:00 龙虾让千人排队 2. 07:00 工具特别少 3. 11:00 文件当记忆 4. 17:00 角色定义 5. 18:10 代码结构 6. 23:35 三代工程的演进：Prompt → Context → Harness 7. 28:49 OpenAI, Vercel, Anthropic, Manus的案例 8. 40:24 六条收敛的模式 9. 42:50 AI 工程师的新出路 10. 47:11 我自己的实践体验 11. 52:35 不卷模型，卷缰绳 ===================================== * Lost in the Middle: How Language Models Use Long Contexts * Peak Ji (Manus): Context Engineering for AI Agents * 工程技术：在智能体优先的世界中利用 Codex * We removed 80% of our agent’s tools * The Anatomy of an Agent Harness * 最高补贴1000万，地方政府跟风“养龙虾”要谨慎|新京报专栏
55分钟 · 3个月前
251
4
AI下一帧 EP013 | Marble/Genie3: 当世界模型AI 终于学会"做梦"了
前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 "下一帧"。对未来好奇？速戳订阅！小红书b站同名：反向弯曲 ===================================== AI 能生成图片、生成视频，但如果它能生成一个可以走进去、可以交互的世界呢？这期我们聊"世界模型"——AI 领域正在爆发的新方向。Google 的 Genie 3 能从一张图生成可玩的游戏，李飞飞团队的 Marble 能用一句话创造 3D 城堡，腾讯的混元世界已经开源。当 AI 学会了"做梦"，游戏开发的门槛可能被彻底改写。作为前游戏开发者，我会从技术原理讲到产业冲击：世界模型到底怎么工作？现在能玩到什么？创业公司 Mirage 为什么从爆火到关闭？Unity 股价为什么因为这个技术暴跌？中国在这个领域是什么位置？如果你是游戏开发者、AI 从业者，或者对"AI 会怎么改变创作"这个问题感兴趣，这期值得听完。 ===================================== 03:26 从"画图"到"造世界"：AI 生成内容的进化路线 08:15 现在能玩到什么样的“世界模型”？ 13:24 技术深水区：AI是怎么理解世界的 23:36 落地场景畅想 27:04 unity股价下跌了21% 31:43 房间里的大象：版权问题 34:32 中国视角：我们在什么位置？ 36:43 结尾：当 AI 学会"做梦"，游戏行业会怎样？ ===================================== * Google DeepMind Genie 3 官方介绍 * World Labs Marble 官网 * 腾讯混元世界 HunyuanWorld 1.5 * Runway GWM-1 * 李飞飞博客: From Words to Worlds: Spatial Intelligence is AI's Next Frontier * 一文讲清楚世界模型 * Unity says its AI tech will soon be able to 'prompt full casual games into existence'
43分钟 · 3个月前
65
0

前游戏开发者，现海外云厂商架构师 [反向弯曲] 主理的 [AI×游戏] 播客！帮助互联网｜游戏从业人员拆解全球游戏 AI 前沿动态，深挖技术落地干货。让你轻松拿捏行业脉搏，预判 AI + 游戏的 “下一帧”。对未来好奇？速戳订阅！小红书b站同名：反向弯曲邮箱：5155280@qq.com