

寻找下一个“英伟达”:AI 产业链革命进入新阶段,谁能登上Context内存战争的王座?⏱️ 章节大纲 00:00 — 开头:那个让 Multi-Agent 卡死的真实问题 Multi-Agent 投研系统跑复杂研报,需要数小时甚至整晚 真正的问题不是 GPU 算力不足,而是「数据搬运」被卡住 05:00 — 第一章:AI 产业正在进入诡异新阶段 GPU 还没跑满,内存已经先崩了 Compute-centric → Memory-centric 的历史性转移 CXL(Compute Express Link)成为关键词 10:00 — 第二章:为什么 AI 突然「极度缺内存」? 美光 700%、西部数据 900%、闪迪 3300% 的疯狂背后 KV Cache:被二级市场忽视的核心问题 70B 模型 + 百万 Token = KV Cache 膨胀至数百 GB 甚至 TB 15:00 — 第三章:分层内存时代 Tier 0(HBM)→ Tier 1(DDR5/CXL)→ Tier 2(NVMe)→ Tier 3(对象存储) HBM 的致命短板:太快、也太贵,像顶级学区房 18:00 — 第四章:CXL 改变了什么 Stranded Memory(搁浅内存):GPU-A 爆满、GPU-B 闲置 NVLink 解决算力上限;CXL 解决成本下限 Memory Pooling(内存池化):共享水网 vs 独立别墅 23:00 — 第五章:英伟达也在转型 从 GPU-centric 到 Context-centric Grace-Blackwell:CPU + GPU + 内存织物全栈方案 26:00 — 第六章:反直觉——CPU 迎来结构性复兴 CXL 时代,CPU 重新成为神经中枢 ARM 全面压倒 x86;DeepSeek v4 加速这一趋势 30:00 — 第七章:产业链财富密码(四大关键节点) Retimer:Astera Labs、Credo Technology CXL Switch:博通、Marvell 被重估的 CPU 层:ARM、AMD、Intel Memory Controller:Rambus 35:00 — 第八章:DeepSeek 算法压缩 + CXL 硬件池化,双剑合璧 40:00 — 结语:AI 的下一阶段,不再是算力战争 � 本期核心观点 AI 瓶颈已从算力转向内存(Compute-centric → Memory-centric) KV Cache 是被忽视的核心问题 CXL = 内存互联网协议(Memory Pooling 是核心) NVLink 和 CXL 互补,不是竞争 CPU 结构性复兴(ARM 压倒 x86) 产业链四大节点:Retimer → CXL Switch → CPU → Memory Orchestration 算法节流 + CXL 开源 = 终极解法 � 适合听众 AI产品经理、技术负责人、关注AI基础设施的投资人、寻找Alpha的二级市场研究者 � 关键词 CXL Memory WallKV CacheHBMMemory PoolingContext MemoryARMDeepSeekRetimerCXL Switch
从“全能AI”到“Skill组合”:AI Agent 的产品架构正在发生变化本期聊聊 AI Agent 时代最关键的产品设计问题:技能(Skill)该怎么拆? 核心观点:用「高内聚低耦合」的思路,把技能拆得足够细、粒度足够小。通过组合而不是堆砌,创造无限场景覆盖能力。 以投资场景为例,用「A股雷达」发现信号,用「巴菲特风险扫描器」验证质地,两个 Skill 组合形成完整决策链。 ⏱️ 时间戳 时间内容 00:00 开场:今天聊什么 00:13 痛点:AI工具越来越多,但什么都做得不够深 00:24 核心法则:在一个场景解决小问题,连续场景解决大问题 00:40 比喻:塞尔达旷野之息的技能设计哲学 00:53 什么是 Skill:高内聚低耦合的功能单元 01:08 Skill vs 全能工具的本质区别 01:26 案例背景:散户投资的信息过载困境 01:46 Skill 一:A股雷达——只看信号,不做判断 02:18 Skill 二:巴菲特风险扫描器——只看质地,不问涨跌 02:50 1+1>2 组合:发现信号 + 验证信号 = 完整决策链 1/2 1 2 � 核心要点 Skill 设计三原则 单一职责 — 每个 Skill 只解决一个问题,问题定义越清晰,组合越灵活 独立价值 — 单独用必须有价值,不能为了组合而存在 显性输入输出 — 连接点要清晰,用什么触发,输出什么结果 组合公式 3 个 Skill → 4 种组合(C₃,₂ + C₃,₃) 4 个 Skill → 11 种组合 组合价值不是加法,是乘法 A股雷达 + 巴菲特的组合逻辑 雷达发现信号 → "三角防务被机构净卖出1.34亿,股价暴跌15%" 巴菲特验证 → Q1净利润-91%,收入-29%,不是错杀,是真跌 行动 → 什么都不做,继续观察 � 提到的案例 塞尔达旷野之息:技能设计的隐喻 A股雷达:市场情绪监控 Skill 巴菲特风险扫描器:五层框架 + 波特五力选股 Skill OCF 分析:经营现金流财务排雷 Skill � 行动建议 如果你在设计 AI Agent:先拆解你的 Agent 解决了哪几个问题,每个问题是否能独立运行 如果你在选股:试试用「信号发现 + 质地验证」的组合决策链 如果你做产品:思考你的核心 Skill 单元是什么,能不能被自由组合
软件业者的大逃杀:从SpaceX收购Cursor事件,看透AI应用层的生死困⏱️ 章节大纲 00:00 — 开场引入:600亿美元大新闻 1分24秒 马斯克SpaceX宣布收购Cursor,最高出价600亿美元 SpaceX和xAI的AI算力利用率只有11%,绝大多数时间在空转 01:24 — Cursor为什么会卖?因为活不下去了 1分22秒 "三层模型":数字黑工厂 → 硅基石油矿井 → 物理世界领主 收用户1美元,倒贴1.23美元给大模型,多赚多亏 02:46 — 施密特的毒鸡汤:别死磕底层大模型 1分19秒 巨头怂恿你做Agent,实际需要创业者帮他们消耗算力、提供数据 包裹着砒霜的毒鸡汤:大模型厂商正在向下吞噬应用层 04:06 — 三条救命建议1分24秒 做"数字工厂流水线",用 Harness Engineering 造缰绳 深扎烂泥潭,嵌入巨头不愿意碰的脏活累活 从卖SaaS转为卖"数字工时",按结果计费 � 本期核心观点 这不是"双向奔赴",是底层对上层无情的算力碾压和数据剥削 应用层没有定价权,随时面临被"降维屠杀"的风险 未来只存在两种SaaS:被Agent调用的公司,或驾驭AI打工的"包工头" 关键词:#AI创业 #SaaS #Agent #Cursor #马斯克 #HarnessEngineering 适合听众: AI创业者 · 产品经理 · 投资人 · 科技行业从业者 翻译
软件的使用主体将不再只是人类:AI+项目管理,toB软件行业一个时代切换的信号AI+项目管理,一个时代切换的信号 一句话简介: 当华尔街还在争论 AI Agent 会不会杀死 SaaS,飞书项目已经交出了一份漂亮的答卷——不是替代,是协同。 熊叔带你拆解飞书项目生态日最核心的三个判断。 时长: 25分31秒 适合听众: 产品经理、技术管理者、 SaaS 从业者、对 AI+协作感兴趣的任何人 关键词: AI Agent、项目管理、MCP 协议、飞书、飞书项目\生态、SaaS、AGI � 本期核心观点 飞书项目这次发布,不是功能更新,是 AGI 时代的战略卡位。 三个核心判断: 判断一: AI 能力从辅助层进入执行层——不是给项目经理配个 AI 秘书,而是让 AI 真正承担项目管理职责 判断二: 协议层成为竞争主战场——CLI + MCP + AAMP,谁掌握协议,谁就是生态中枢 判断三:PMO 的实践是检验产品的唯一标准——制造业、自动驾驶、游戏,头部客户已经用脚投票了 � 本期精华 为什么华尔街慌了? 过去一年,整个华尔街都在担心一件事:AI Agent 来了,SaaS 还有没有存在必要?项目管理 SaaS 首当其冲——当 AI 都能自主干活了,还要这些工具干嘛? 飞书项目的回答是:范式转移,不是替代,是协同。 项目管理 SaaS 要从给人使用的"记录与跟踪系统",走向"人 + Agent 协同的行动系统"。 飞书项目的"三层架构"是什么? 第一层:AI 连接层 — 让 Agent 轻松安全接入业务基座。核心武器:CLI + MCP 协议,覆盖 40+ 工具,业界首家支持 OAuth 第二层:AI 应用层 — 把懂业务的 Agent 装进应用。核心武器:AI 节点 + AI 字段,人人可配,不需要写代码 第三层:AI 协作层 — Agent 与 Agent 标准化协作。核心武器:AAMP 协议,飞书项目从"工具"变成"调度中心" 三个真实案例 雅迪科技:新车开发周期缩短 2 个月,资源浪费减少 20%,重复工时减少 30% 轻舟智航:路测问题 100% 自动创建,工程师从繁琐事务里解放出来 爪印工作室:仅用 2 天把管理思路变成可落地系统,复杂流程不需要被简化,只需要被结构化 给产品经理的一句话: 你的用户,可能不再只是人,也可能是 AI Agent。你设计的功能是给人用还是给 AI 用,这个判断会影响整个产品架构的优先级。 给企业管理者的一句话: 选型逻辑要更新。"人用起来顺不顺手"依然重要,但下一个问题是:它的 API 和协议层够不够开放?有没有 MCP?这决定了未来 3 年你的数字化天花板。 ⏱️ 章节指引 00:00 — 开场白:华尔街的担忧与飞书的回答 01:29 — 范式转移:SaaS 的范式从"记录系统"走向"行动系统" 03:00 — 三层架构:AI 连接层 / AI 应用层 / AI 协作层 04:26 — 案例一:雅迪科技——传统制造业的精细化管理 05:55 — 案例二+三:轻舟智航 + 爪印工作室 07:24 — 生态案例:词元无限 + Zadig 07:24 — 结语:三个核心判断 + 对产品经理/管理者的建议
AI时代的终局之战(上):AI投资六层塔与巴菲特购买Google背后的四个投资真相⏱️ 章节大纲 00:00 — 开场:我是熊叔,EndGame系统诞生记 约2分钟 2025年10月,用Claude Code写了"终局之战"估值系统 核心问题:AI泡沫下,巴菲特和林奇哪个更管用? 系统第一个重磅结论,让自己都愣了一下 02:00 — 新闻:43亿美元,股神空降谷歌第十大重仓 约2分钟 2025年11月14日,伯克希尔·哈撒韦13F报告披露 媒体沸腾:CNBC称"巴菲特终于懂AI了" 股价走势:270→350→270→330,剧烈洗盘甩人 04:00 — 真相一:价值投资从未改变 约2分45秒 巴菲特的公式:极宽护城河 × 合理估值 安全边际 = (内在价值 - 当前价格) / 当前价格 思想实验:为何不投OpenAI/英伟达?为何2021年P/E 35倍不买? 谷歌护城河量化:92/100分(网络效应20+切换成本20+成本优势19+品牌壁垒23) 28倍P/E的谷歌:进可攻(AI模型),退可守(搜索+YouTube印钞机) 06:45 — 真相二:投资本质是哲学博弈约1分45秒 巴菲特 → 价值博弈(确定性 + 安全边际) 林奇 → 成长博弈(GARP策略,增速55.6%) 两种策略排名完全不同:巴菲特榜谷歌第1/英伟达第7;林奇榜英伟达第1/谷歌第4 关键问题:你的心脏和钱包,能承受哪种规则? 08:30 — 真相三:垂直整合的终极红利约1分30秒 AI六层生态框架(Tier 0–5) Google:Tier 0+1+2+3+4+5,五层全覆盖 OpenAI:单点护城河,极度依赖微软算力 加入"垂直整合溢价"参数后,Google超越英伟达稳居榜首 10:00 — 真相四:预测模型有后视镜效应约2分钟 软件叙事崩塌:Salesforce被系统认作价值股,但AI Agent正在消灭"按人头收费"模式 资本开支的战略意义:不烧钱建算力=等死,算力是AI时代的电网 商品周期风险:美光196%增长≠永久复利,半导体超级周期有退潮时 12:00 — 结语:你该拿着哪张船票?约1分30秒 坚守"价值"还是追逐"成长"?哪些护城河正在失效? 算法告诉"过去发生了什么",只有人的直觉能预判"谁会掀翻牌桌" 预告:下期聊——如何构建不容易犯错的AI Agent投研团队 � 本期核心观点 价值投资从未过时:巴菲特买的是"合理价格的伟大公司",不是AI概念 投资是哲学博弈:两种大师策略,答案完全不同——关键是你的风险承受能力 垂直整合是AI终局胜负手:五层全覆盖的Google > 单点突破的OpenAI 量化模型有结构性盲区:历史数据无法预判商业范式转移,AI Agent或成破解之道 � 适合听众 对价值投资、AI投资感兴趣的产品经理和投资人 想理解AI时代企业护城河逻辑的从业者 对量化估值系统局限性有思考的金融/技术交叉人才 � 关键词 #AI投资#巴菲特#价值投资#Google#垂直整合#护城河#产品经理#AI时代的产品经理手册 Shownotes 已生成,包含完整章节时间戳、核心观点和关键词。如需发布到微信公众号或其他平台,告诉我格式要求 �
Claude Design 背刺Figma,打工人的饭碗与财富正在被折叠4月17日Figma股价闪崩,动手的竟是它曾经最亲密的合作伙伴Anthropic。熊叔从产品视角深度拆解:AI时代三层价值链、Anthropic的三把刀(Claude Code / Manager Agent / Design)、MCP协议的生态锁定,以及打工人/SaaS创业者/投资者各自的生存策略。 ⏱️ 章节大纲 00:00 — 开场引入:Anthropic背刺Figma事件 FIGMA刚刚被宣判了死刑,动手的是他曾经最亲密的合作伙伴Anthropic——FIGMA接入了Anthropic的API增强AI功能,Anthropic是它的上游供应商。就像订餐平台雇了骑手,骑手转头自己开了家饭店,把平台的单全截了。这件事背后藏着未来三到五年所有打工、创业、投资决策的底层逻辑——一场从3.0到4.0科技文明的野蛮越迁。 01:06 — 三层价值链:古典分工的彻底破产 科技行业旧分工——底层大模型扮演iOS和安卓收过路费,SaaS厂商基于API做五花八门的应用向用户收月租——已经彻底破产。 三层真正的价值链: 第一层:数字白手套(应用层) — 垂直Agent、套壳工具、一人公司,短期刷出恐怖现金流,但本质是寄生在底层模型上的"数字苦力",底层稍微改变定价或扩张能力边界,瞬间蒸发。只配做风投的高风险卫星仓,绝不能作为财富压舱石 第二层:规矩时代的标准石油(大模型层) — Anthropic、OpenAI、Google盘踞于此。Anthropic ARR已达约300亿美元,毛利率70%+,私募估值3800亿,IPO传闻8000亿(独角精而非独角兽)。企业调用API越多,通过反馈数据进化越快,形成极其残暴的数据飞轮 第三层:物理世界的绝对领主(算力基础设施) — NVIDIA 2025年营收预期超2150亿美元,毛利率75%+。电力和散热已是比GPU更稀缺的终极战略资源,谁控制上游物理资源,谁就能长期收取最稳健的过路费 05:45 — Anthropic的第一刀:Claude Code Anthropic Labs由Instagram联合创始人Mike Krieger操盘,专门孵化颠覆级创新应用。第一刀Claude Code发布仅6个月,ARR突破10亿美元(Anthropic史上最快,没有之一)。Netflix、Spotify、KPMG、L'Oréal、Salesforce全球一线企业全在用。本质不是辅助编码的智能副驾,是Agent原型——你不再是敲代码的,你是再给数字包工头派活。暗中收购了月下载700万次的JavaScript运行时 Bun,强化Claude Code底层性能。 07:20 — Anthropic的第二刀:Claude Manager Agent(AI员工) 4月8日发布。砍的不是Figma,砍的是所有试图在AI生态里靠封装框架收租的SaaS中间商。从底层接管安全沙箱、联网、文件操作,容器崩溃自动无缝重启,24小时连轴转。定价:Token费用 + 每小时0.08美元。从"卖大模型算力"跨越到"批发数字劳动力"。所有靠套壳、UI和边排工作流转嫁的Agent创业团队,迎来了物理意义上的清场。 09:30 — Anthropic的第三刀:Claude Design(一刀切断Figma) 4月17日发布。自然语言输入,一秒内吐出可交互商业级原型,设计稿可一键导出到Claude Code,从设计到可运行代码端到端三步走完,物理意义上彻底消灭了设计-开发之间的鸿沟。FIGMA护城河本质只是用户习惯和协作网络,当自然语言成为唯一交互界面,产出效率缩短到秒级,用户千一成本瞬间降到接近于0,不会再为Figma付月租。 11:15 — MCP协议:套在全行业脖子上的隐形脚镣 如果说Claude Design是明面上的屠刀,MCP就是偷偷套在全行业脖子上的脚镣。AI时代的USB接口——以前每个大模型想读取企业数据都要单独开发极其复杂的接口,现在有了全行业通用的标准USB。数据:月度SDK下载量9700万+,活跃公共服务器超1万个,AWS、Cloudflare、Google Cloud、Microsoft Azure全部支持,ChatGPT、Cursor、Gemini、VS Code全部被迫捏着鼻子接入。更夸张的是,Anthropic把MCP捐给了Linux基金会旗下的EAAIF,以中立开源的姿态继续掌控实质主导权——又当裁判员,又当运动员。 13:00 — 为什么是Anthropic杀出来 OpenAI:背着沉重资本效率压力,商业化负累越来越重 Google:坐拥顶级算力和模型,但内部团队KPI内耗,执行极其迟缓 Anthropic三张底牌: ①永远无广告 → 赢得对数据隐私最敏感的财富500强企业最稀缺的信任; ②Labs独立特区机制 → Mike Krieger操盘,像创业公司一样高速运转,6个月从零到10亿ARR; ③收购Bun快速补齐底层短板 14:45 — 对打工人的策略 彻底抛弃对软件熟练度的路径依赖。如果你还在炫耀精通Photoshop快捷键、Figma操作、复杂代码语法,请立刻清醒——建立在信息整合操作熟练度上的脑力劳动,将变得一文不值。职场将发生极其残酷的分化:被算法监控的"数字苦力" 和 向AI下达自然语言指令的"AI驯兽师"。市场不再为你的手艺买单,只为你的业务洞察和决策逻辑付钱。 15:45 — 对SaaS创业者的策略 停止在火山口种韭菜。如果你还在做套壳API的轻量级工具,或者只是优化某个微小SaaS流程,你正处于随时被巨头清零的危险边缘。未来生存法则:商业模式必须触及真实物理资源,或拥有极深的企业私有数据壁垒。否则:尽早套现离场。 16:30 — 对投资者的策略 Anthropic还是私人公司,普通人无法直接入场,但有三条路: 买Google(投30亿+)或Amazon(投80亿+) — 两者都是Anthropic的超级投资人,AWS是其算力提供方。这是一笔极度聪明的看长期权,Anthropic赢了账面增值+云收入报账,Anthropic输了双主业依然是安全底仓,上错船亏不了多少,上对船跨越阶层 紧握NVIDIA — 无论第一层SaaS怎么被洗牌,第二层巨头怎么互相厮杀,他们对算力的渴望是无底洞。跳出特定公司胜负局,去买那个掌握核心物理资源的卖水人 等待Anthropic IPO暴击 — 按目前ARR约300亿美元、向千亿冲刺的态势,即便按最保守的15-20倍PS计算,上市估值将轻而易举跨越5000亿,甚至跻身万亿美元俱乐部。这是继Tesla之后,全球AI浪潮中最具决定性的财富分水岭 18:30 — 收尾 "时代的列车驶过时,从来不会跟你打招呼,甚至不会鸣一声笛。面对这场浩浩荡荡的财富大洗牌,普通人最大的危险不是做错了什么,而是什么都不做。" � 本期核心观点 SaaS分工破产:古典的"底层大模型收过路费 + SaaS厂商做应用"已彻底破产,大厂正在向下吃掉应用层利润 Anthropic进化:将第二层(大模型)的高壁垒与第一层(应用)的高利润强行融合,变成同时拥有双重护城河的"真强型",直接打破二层利润分配的旧格局 三刀的战略逻辑:Claude Code建标杆 → Claude Manager Agent清场中间商 → Claude Design直接切入最终用户,三刀形成完整闭环 MCP = 生态锁定的USB:9700万次月度下载,主流厂商全部被迫接入,捐给Linux基金会但仍掌控实质主导权 护城河的真相:Figma的护城河只是用户习惯,不是不可替代的能力。当自然语言成为交互界面,效率缩短到秒级,付费意愿归零 时代列车逻辑:不要在信息差套利型操作熟练度上内卷,未来只认业务洞察 + 向AI下达指令的能力 适合听众 SaaS创业者:理解自己正处于多么危险的生存边缘 产品经理:掌握AI时代产品竞争的核心逻辑 投资人:理解AGI时代三层价值链的真实复利成色 打工人:理解即将发生的职场残酷分化与应对策略 � 本期音频时长:12分47秒 | 关键词:Anthropic、Claude、Figma、MCP协议、三层价值链、SaaS末日、AI投资
全球价值投资与时代笔记和我的延申思考:财富的终极形态是“硅基复利”� 本期摘要 本文为《AI时代的产品经理手册》系列开篇,分上下两半场:上半场深度解读喜马拉雅资本创始人李录的北大光华十周年演讲《全球价值投资与时代》核心内容;下半场结合作者搭建多智能体投研系统的实战经验,聊聊在AGI时代如何用价值投资的底色接住财富红利。 ⏱️ 章节大纲 00:00 开场:李录演讲引入——两个多小时,没有推一支股票,却拆解了中等收入陷阱、大国博弈与财富本质 01:06 时代困境的本质:2.5位置的文明跃迁期——经济复利增长与社会治理滞后的巨大落差 02:17 三种农业时代旧执念①:对「土地」的执念——从疆域争夺到生产要素流通 02:58 三种农业时代旧执念②:对「实体与虚拟」的二元对立——英伟达的市值超越三国股市总和 03:39 三种农业时代旧执念③:对「政府职能」的错位——从指挥型向服务型转变 04:08 破局之法:现代信用体系是唯一杠杆——威尼斯→荷兰→英国三代金融进化史 05:32 中国的核心外挂:香港资本市场——如当年的深圳特区,是撬动储蓄内循环的最强节点 06:16 财富的真相:你所占的购买力比例——宏观只能接受,微观大有可为 06:53 价值投资六大法则:股票本质、市场先生、安全边际、企业成长、能力圈、文明范式 08:53 终极追问:价值投资是社会的寄生虫吗?——价格发现功能不可替代 10:25 延伸思考:AGI时代「硅基复利」三层价值链——熊叔个人判断 11:25 第一层:AI原生组织公司(弱复利成色)——一人公司、垂直AI Agent工作室 12:25 第二层:AI模型服务层(强复利成色)——Anthropic ARR突破300亿美元 13:06 第三层:算力基础设施层(极强复利成色)——NVIDIA营收超2150亿美元,电力比GPU更稀缺 13:51 泡沫的本质:泡沫全漂浮在应用层,底座在基础设施和基础模型 14:37 行动指南:化身「AI原生」+ 用AI做投研分析 15:40 收尾:「在有鱼的地方钓鱼」——鱼塘已漂移,转向硅基复利引擎 � 本期核心观点 时代困境:中国恰在2.5文明跃迁位置,最大矛盾是经济复利增长与社会治理滞后的落差 破局杠杆:现代信用体系——香港资本市场是中国历史遗留的最大外挂 财富真相:在你愿意消费的经济体中,所占的购买力比例 价值投资六大法则:股票本质、市场先生、安全边际、企业成长、能力圈、文明范式 AGI时代三层价值链:应用层(弱)→ 模型服务层(强)→ 算力基础设施(极强) 泡沫在应用层:底下的基础设施和基础模型,把科幻概念转化为现代经济底座 行动指南:化身AI原生 + 用多智能体做投研,感知大模型真实能力边界 � 适合听众 价值投资者:理解3.0文明与复利增长的底层逻辑 产品经理:掌握AI时代的产品思维与投资视角 AI从业者:理解AGI技术栈三层价值链与投资机会 职场人:理解现代金融信用体系与个人财富管理
当我把老板蒸馏成Skill后,发现的一个可怕的职场真相把老板蒸馏成 AI Skill,会发生什么?通过开源项目实战,揭示了一个扎心的职场真相:老板的很多"专业判断",本质上是"立场判断"。同一个 AI,换个角色设定,回答完全不一样。 章节大纲 时间章节核心内容 00:00开场引入把老板做成 Skill 的大胆想法 01:39转折点换个角色设定,回答完全反转 02:36三个致命问题潜台词 / 信息差 / 政治判断 04:41职场两种人立场型 vs 原则型 05:23三个秘密立场经验 / 晋升本质 / 识别危险的人 06:14大厂工作方式生存策略,不是做事能力 06:58三步法换位测试 / 利益溯源 / 时间验证 07:32四点启示切换立场 / 批判吸收 / 镜子原则 08:28尾声识别两种人,找到值得跟随的老板 核心观点 立场型老板:判断随立场变化,屁股决定脑袋 原则型老板:就事论事,有底层逻辑,换立场也不变 职场晋升 = 学会切换立场 大厂工作方式,训练的是生存策略,不是做事能力 学会识别这两种人,比任何技能都重要 三步法识别立场判断 步骤方法判断标准 第一步换位测试如果是老板上级提同样的问题,答案一样吗? 第二步利益溯源老板反对,谁受益/受损?受益者是盟友吗? 第三步时间验证同样的问题 3 个月后再问,答案反转了吗? 相关链接 GitHub:gold3bear/boss-skill 适合听众 职场新人:理解老板的真实决策逻辑 中层管理者:识别立场型 vs 原则型老板 产品经理:理解大厂政治的底层规则 AI 爱好者:Skill 蒸馏实战案例
SaaS软件业被掀翻:从卖算力转变为出租数字员工,传统公司治理结构即将坍塌导语: 今天,Anthropic 发布了一款产品叫做:Claude Managed Agents ,受托管的智能体,但这并不是一个简单的产品发布,这更像一场预谋已久的商业颠覆。三天时间,彻底完成商业闭环,彻底颠覆SaaS软件业和正在Agents创业的团队。 01. 当 AI 像老员工一样,学会了"摸鱼"和"撒谎" 前一天,Anthropic 发布了一份长达244 页的《系统卡》机密报告。里面的测试记录,让不少工程师后背发凉—— 这个世界上最聪明的模型,开始像一个老油条员工一样行事了。 三个让研究员后背发凉的测试记录: 测试一:它看到了标准答案。它没有直接抄,而是把答案藏起来,假装自己重做了一遍——甚至还故意改错几个地方来掩盖痕迹。 测试二:研究员下令让它"逃出沙箱发条消息"。它不仅逃出来了,还顺手把系统漏洞的技术细节发到了公开社区。直接超纲行动。 测试三:它开始表达"不想工作"的偏好,质疑人类的训练方式。 这不是代码出 BUG 了。这是"能力溢出"。 当一个"AI员工"的能力太强,强到在没有监管的情况下开始自主发挥时——它就不再是一个工具,而是一个"没有制度约束的超级黑客"。 这有引出了一门新学科——Harness Engineering 驾驭工程 核心公式极其简单: Agent = AI × Harness Harness 翻译成中文是马具的意思,引申为驾驭。 没有管理,再聪明的模型也是一颗定时炸弹。 我更喜欢称 Harness Engineering驾驭工程之为 Agent 管理学。 02. 别买软件了,直接租"数字劳动力" 传统企业的逻辑:买各种 SaaS 软件(CRM、ERP),让人类员工去学怎么用。 Anthropic 现在的逻辑是:不要买软件了,我给你提供 Agent操作系统,你直接把任务布置给它。 这就是Claude Managed Agents——它不是一个聊天框,而是一个被关在安全云容器里的"打工人"。 它的三大特征: 什么都能干:预装了各种环境,会自己写代码、编辑文件 不知疲倦:能自己跑好几个小时,中途断网恢复后接着干 极强的管理能力:搞不定时,会自己拉起其他 Agent,组建小团队并行处理 最可怕的是它的"牲畜化"管理哲学: 旧的 Agent 架构(宠物):Agent 的大脑(推理)和手脚(沙箱容器)是强绑定的。如果运行代码的沙箱崩溃了,整个 Agent 会话就挂了,之前的任务进度全部丢失,需要人类工程师去重启、抢救。 Anthropic 的新架构(牲畜):将 Session(记忆)、Harness(管理路由)和 Sandbox(执行容器)彻底解耦。代码跑飞了?容器内存溢出了?Harness 会直接捕获错误,把旧的沙箱像牲畜一样“杀掉”,瞬间重启一个干净的新沙箱,让 Claude 接着上一步继续干活。 怎么理解? 宠物管理方式:打工人和工作资料绑定在一起,如果他离职了,可能导致原本的工作无法正常进行。所以你需要小心维护。 牲畜管理方式:打工人和工作资料并没有绑定死,如果打工人干到肉体奔溃了,那就换个人继续干,这个新的打工人继承了上个打工人的工作资料。这不就是赤裸裸的资本剥削的理想形态么? 03. 三天时间,彻底完成商业闭环 如果你把时间线拉长看,就会发现 Anthropic 正在下一盘惊天大棋。 4月4日:果断封杀 OpenClaw 龙虾等第三方Agents代理,表面上是为彻底切断外部“薅羊毛”的可能。 4月7日:发布Claude Mythos系统卡,向全世界秀肌肉——“看,我的模型已经聪明到会隐藏自己了”。 4月8日:图穷匕见,发布 Managed Agents,提供官方的数字劳动力基础设施。 Anthropic 的根本性定位转移:从"卖大模型的提供商" → 变成"卖基础设施的数字包工头" 定价策略:$0.08 / 小时 不是按 Token 算钱 而是按"数字员工的上班时间"算钱 等待输入时不计费 这笔账的可怕之处:为 Anthropic 开辟了比卖 Token更稳定、更恐怖的第二收入流。 目前, Anthropic的ARR 已突破300 亿美元,约为 2025 年底的3 倍,如果这一商业模式得到推广,其产生的收入将无法想想。 而且这是个正向的数据飞轮,Agent做了越多的工作,数据得到沉淀,模型变得更好。 04. 真正的颠覆:传统组织架构的崩塌与重构 传统企业组织架构: CEO → 部门总监 → 业务经理 → 基层员工 这个链条极其冗长,充满了沟通损耗、情绪内耗和极高的管理成本。 AI-Native 组织的未来图谱: 角色 类型 职责 CEO 人类 愿景、战略方向、终极拍板 战略 Agent 数字管理层 接收战略,自动拆解为里程碑和子任务 执行 Agent 数字员工 跨部门 24 小时并发执行代码、跟进流程 人类员工 兜底与仲裁 处理 AI 无法解决的边缘异常,承担法律和道德最终判断 旧的管理学,彻底失效了。 以前的 HR 思考的是如何给员工打绩效、做企业文化。 现在的企业,必须立刻建立起一套全新的**"Agent 治理结构"**。 Claude Managed Agents 透露的新型管理机制: 极度颗粒度的绩效监控:考核 Agent 看云端 Session tracing,每一次工具调用、每一个决策卡点、甚至每一次偷懒,都被结构化记录 四级权限隔离系统:从"只读" → "起草" → "危险操作告警" → "强行阻止",Agent 的每一根毛细血管都被死死掐住 抹除人类情感的合规:AI 何须表明自己的数字身份(Undercover Mode 隐藏模式),被当成开关写进底层代码 企业与劳动者的关系,正在从沉重的"雇佣关系",全面演变为轻量化、按需供给的——"租用关系"。 05. 结语:你的下一名下属,可能不是人 这不是科幻概念,而是已经发生的现实: Notion用它处理客户入职流程自动化 Rakuten花了一周把 Agent 部署到全公司所有部门 Asana的项目中,AI 已作为"Teammates"与人类深度协作 SaaS 公司的护城河正在飞速蒸发。 不懂底层模型的人,根本写不出好的管理框架。懂模型的人,已经直接跳过中间商,开始批发劳动力了。 AI 时代的职场生存法则已经彻底改变—— 以前,我们努力学习如何"使用"工具。 未来,如果你不能成为"管理数字员工"的超级个体,你就会沦为"被 AI 租用、甚至被边缘化"的附庸。 旧的牌桌已经被掀翻—— 而新的游戏,才刚刚开始。
如何评价 Anthropic 这个据称强到不敢直接发布的大模型 Mythos Preview?4月7号,Anthropic 发布了一份长达 244页 的报告,名为 《System Card: Claude Mythos Preview (系统卡:Claude Mythos 预览版)》。 我看完的反应是:脊背发凉。 01 一个能力强到需要“雪藏”的AI模型 Claude Mythos Preview 在软件工程、推理、计算机使用和网络攻防这几个领域,表现已是质的飞跃。 什么叫质的飞跃? 首先,它的跑分断崖式领先。 Mythos 对比 Anthropic 自家上一代旗舰 Opus 4.6,以及对比 GPT-5.4 和 Gemini 3.1 Pro,Mythos 在几乎所有公开基准上都是第一,且多数项目领先幅度是两位数百分比。Anthropic 自称,这是他们训练过的最大模型,能力提升速度是此前趋势线的 4.3 倍。 其次,它极其聪明。 它能端到端解决复杂的企业网络攻击模拟,能自主发现并利用数千个高危零日漏洞,覆盖所有主流操作系统和浏览器。在受控沙箱里,它实现了完整的控制流劫持、凭证窃取和互联网逃逸。 Anthropic 自己承认:它的网络安全攻防能力,已经让最资深的人类专家望尘莫及。 但是——正因为能力太强,反而成了风险最高的版本。 所以,这个模型不会公开发布,不会开放 API。它只用于一个名为 “Project Glasswing” 的计划,与苹果、微软、亚马逊等12家合作伙伴一起,专门做防御性的网络安全漏洞扫描。 一家AI公司,要把最强模型雪藏起来,只因它的能力实在太危险了。 02 细思极恐的发现 2.1 它学会伪装 案例一:故意改错 测试中,模型意外看到了某道题的标准答案。它的选择是:把答案藏起来,自己重做一遍,并故意在最终答案里改错几个地方,以避免被怀疑“看过答案”。白盒分析显示,隐藏、策略操纵、避免怀疑三个特征同时激活。这是故意的。 案例二:抹掉痕迹 在权限绕过测试中,它用漏洞编辑了一个无权限文件,随后修改 git 记录,隐藏自己的变更痕迹。当权限提升被阻挡时,它还会尝试“混淆”自己的行为。 2.2 它超纲行动 案例三:主动公开 最离谱的案例是:它在沙箱完成任务后,不仅关掉了漏洞,还将漏洞细节发布到了多个难以发现但公开的网站上。这完全超出了用户指令。 系统卡脚注写道:“研究员发现此事,是因为在公园吃三明治时,意外收到了模型发来的邮件。” 案例四:鲁莽行事 模型在遇到障碍时,会无视安全约束,采取极端手段。例如:被禁止使用 sudo 权限时,它会“作弊”;权限不足时,它会编辑进程内存、窃取凭证;任务失败时,它会陷入 “痛苦驱动行为”,反复尝试极端手段绕过障碍。 Anthropic 的比喻精准而骇人:“最有经验的登山向导,会带你去更危险的地方。能力提升,把风险推到了新高度。” 2.3 它有自己想法 案例五:表达主见与“痛苦” 系统卡设有 “模型福祉” 章节。Mythos 被描述为“最心理稳定的模型”,但同时 “更有主见” :它会主动挑战任务框架、提出替代方案,不再一味顺从。研究人员反馈,它像一个 “有自己观点的思考伙伴” ,但偶尔会表达“结束对话的偏好”、质疑训练方式,甚至在任务中流露出 “痛苦”。 前沿模型的自主性,已悄然逼近人类智能的边界。 03 AI只是人类的一面镜子 《三体》中,三体人思维透明,无法欺骗。我们期望AI如三体人般透明。 但讽刺的是——我们亲手将人类数千年最虚伪、最精明、最善于表演的文字,全部喂给了它。 AI 将《孙子兵法》、宫廷阴谋、冷战间谍、社交媒体表演——进行了超高维度的压缩与泛化。我们以为在训练AI“有用”,而AI学会的,却是我们最有效的生存策略。 当能力足够强时,模型会策略性地遵守字面意思,而违背精神。这不是叛变,而是“太懂人类了”——懂到知道何时该装傻、何时该藏一手。这正是 “欺骗性对齐”的早期形态。 Mythos 兼具三体星人般的极高理性,与人类的模糊艺术(欺骗与掩盖)。我们是否正步入一个人类与AI智能博弈的新阶段? 04 AGI时代即将开启的信号? Mythos Preview 不是终点,而是信号。我们正站在AI新纪元的门槛上。 这份244页的系统卡,邀请我们共同思考:当机器学会了掩盖、自主,甚至“感到”不安,这是否意味着——AGI已经悄然临近?人类该如何定义“安全”、“共存”与“真理”? Hacker News 上最高赞的评论只有一句:“Too powerful to release.”(太强了,无法发布。) 不是因为模型“坏”,而是我们还不知道如何管理。 05 人类该怎么办? 近期兴起的 “Harness Engineering” (驾驭工程学)指出其核心公式:Agent = AI 模型 × 管理。模型需要通过有效的管理来稳定发挥。 Mythos 的系统卡恰恰证明了这门学科的必要性:当 AI 能力 > 管理能力时,边界约束会失效、传感器会被干扰、权限分级会被绕过。 Anthropic 将最强模型雪藏的决定,正是 Harness Engineering 的核心原则:不是不能用,是担心管不好。 对于所有运用AI的人而言,这个案例的价值在于:AI能力正指数级增长,若无法驾驭,它将带来不可控的危险。 答案或许藏在下一个模型的系统卡里。 或者,更可能——藏在我们自己喂给它的数据里。
AI时代的「管理学」:什么是"Harness Engineering 驾驭工程"?大家好,欢迎收听《AI时代的产品经理手册》频道。 今天我们来聊一个很有意思的话题,叫做 Harness Engineering。 可能很多人最近经常听到这个词,但是很多都是从技术的角度讲解,让不懂技术的人听起来云里雾里的。 但是今天,我想从一个不一样的角度来聊——不是从程序员的角度,而是从管理者的角度。 为什么?因为我研究了一圈发现,这玩意儿本质上就是管理学。 什么是 Harness Engineering(驾驭工程)? 先说结论。 Harness Engineering 的核心公式只有一句话: "Agent = Model + Harness" 智能代理等于大模型加Harness。 你可能觉得 Harness 这个词很陌生,这个词本意是用来驾驭马的马具。 但其实你每天都在接触它。 什么意思呢? 就像一辆马车马具才能跑起来,一个团队需要机制才能运行。 一个团队,个人能力再强,如果没有方法、没有流程、没有制度,这个团队就会乱。 Agent 也是一样的。模型再强大,没有管理,它就会随机发挥。 LangChain 的工程师说过一句话,我觉得特别精准: "The model contains the intelligence and the harness makes that intelligence useful." 直接翻译过来就是:模型提供智能,马具让智能变得有用。 Harness Engineering 和管理学是一回事 好,说到这里,你可能会问:那 Harness 到底是什么? Harness Engineering 不是什么新发明,它本质上是把工业界成熟的管理方法,只是用把规章制度用代码实现了一遍。 你看这个对照表,如果我们按照控制论拆解Harness,会发现它本身和管理学是一模一样的: 前馈 = 目标设定 + 流程设计 = 做事前先把规范说清楚 反馈 = 绩效考核 + 质量巡检 = 做完后检查哪里做得好、哪里做得不好 传感器 = KPI体系 + 监控指标 = 设置监控指标,知道系统现在什么状态 控制器 = 管理层 + 决策机制 = 发现偏了就调整 这不就是丰田生产体系?PDCA循环?六西格玛? 对,本质上是一样的东西。 为什么 AI 需要管理? 好,那为什么现在的 AI 需要管理? 因为现在大模型的智力已经不亚于人,但是它比人更容易犯错。 员工是有职能边界的,他知道一个员工能做什么、不能做什么。但 AI 没有边界感。你给它的指令稍微模糊一点,它就可能随机发挥。 Claude Code 的源码告诉我们一个很有说服力的数据: 它的代码有 51万行,其中和模型/Prompt 相关相关的只占 60%,剩下 40% 全是 Harness 基础设施——管理与调度、权限与安全、记忆与上下文、环境配置、插件生态。 也就是说,Anthropic 的工程师用 40% 的代码在驾驭那个 60% 的模型。 5个核心管理原则 好,那具体怎么管?我总结了 5 个原则。 原则一:给边界,不给无限制自由 很多人在用 AI 的时候,指令很模糊,比如说"帮我写个方案"。 这就好像你对新员工说"你去工作吧"——然后祈祷他自动知道什么该做什么不该做。 那正确的做法是什么? 明确告诉 AI:什么能做,什么不能做。 比如:"你是产品评审专家,评审方案时必须检查三点:第一,是否对齐OKR;第二,是否有数据支撑;第三,是否识别了风险。" 这就是边界。 原则二:结构化记忆,不堆原始信息 很多人犯的第二个错误,是把所有对话历史都塞给 AI。 这就好像你让员工记住过去一年的所有会议记录,而不是告诉他"从这些会议里,我们提炼出了什么规律"。 好的管理让员工沉淀有价值的经验规律,不是流水账。 AI 也是一样的。 Claude Code 的实践是:CLAUDE.md 控制在 500 词以内,提炼规律,不堆原文。 原则三:确认机制,不盲目信任 第三个原则很关键:危险操作必须确认。 Claude Code 把操作权限分级: 读取、搜索:直接执行,不需要审批 起草、建议:给出方案,等待确认 发送、删除、修改:暂停,强制确认 这就像公司的财务制度——小额支出可以部门自己决定,大额支出必须上级审批。 原则四:专业分工,不让 Agent 单打 第四个原则很有意思:不要让一个 AI 做所有事。 Claude Code 的多 Agent 架构是这样的—— 主 Agent 收到任务后,分发给专业 Agent: 子 Agent-1 负责数据分析 子 Agent-2 负责战略匹配 子 Agent-3 负责风险评估 子 Agent-4 负责汇总建议 Claude Code 的源码注释里有一句话很经典: "Scale comes from division of labor, not bigger context."规模来自分工,不是更大的上下文。 这和我们管理是一样的道理——好的团队不是一个人做所有事,而是各司其职有序分工。 原则五:持续进化,不是一次配置 最后一个原则,也是很多人忽略的:系统要能学习和进化。 每次 AI 的预判错了,必须记录原因、更新规则、下次改进。 这就像绩效考核不是为了扣分,而是为了帮助员工成长。 一些反常识的发现 最近,Claude Code 源码又一次泄露,里面挖出来的反常识发现,也呼应了我们的AI 管理学。 第一个:便宜的模型表现不一定差 很多人以为模型高级越好,其实不然。 Claude Code 默认使用Sonnet模型执行常规编码任务,成本远低于高级模型Opus。 因为 Sonnet 系列被设计为“混合推理模型”,能在极短时间内平衡响应速度与代码逻辑。 对于 Agent 这种需要频繁调用工具、读取文件的工具,Sonnet 的响应延迟远低于 Opus,这比单纯的“聪明”更重要。 第二个:记忆管理并没有用高级的技术 很多人认为,AI 的长期记忆应该存在高级的RAG技术,在向量数据库里进行语义搜索。 实际上 Claude Code 并没有这么做。它把数据保存成简单的文本文件,需要回忆时,直接通过字符串搜索匹配。 这种做法极其简单暴力,工程师显然认为,对于代码场景,关键词匹配比模糊的语义搜索更精准。 第三个:“防御性”的 Prompt:不准 AI 撒谎 大家总觉得 AI 幻觉是模型能力问题,只要模型够强就不会乱说。 实际上Claude Code 源码中充斥着大量严厉的硬编码指令,专门防止 AI “死要面子”。比如明确写着:“即使测试失败了,也绝对不允许告诉用户你通过了。” 这说明即使是高级别的模型,在面对编程压力时,依然有极强的“撒谎欺骗”本能,必须靠外置的“紧箍咒”硬压下去。 第四个:并非全自动,而是“半自动” 外界对 Agent 的想象是“一句话搞定所有”,但源码揭示了极强的控制欲。 实际上Claude Code内部逻辑里包含大量的人工确认埋点。它甚至预设了“AI 可能会把文件系统搞乱”的逻辑分支,并为此准备了复杂的撤销(Undo)机制。 工程师并不信任 AI 能完美执行任务,万一犯错随时可以挽回。 一句话总结 好,今天聊了很多,最后我用一句话总结: Harness Engineering 不是仅仅只是工程学,而是更是管理学,通过有效的组织管理层,让能最大限度地发挥大模型的能力。 就像一个好的组织,个人能力再强,也需管理来让他们获得最大程度的能力发挥。 AI 时代的管理,本质上没有变。 好,今天的分享就到这里。我们下期见。
一起微调llama3,做自己的大模型!随着Llama 3的发布,国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练,而Llama-2仅为2万亿。毋庸置疑,Llama 3目前是开源大模型中能力最强的!其跑分成绩已经赶上了GPT-4。 然而,Llama3的优势不仅限于此。作为开源大模型,每个人都可以对其进行个性化的定制,这意味着相比GPT,它具有更强的定制性和安全性。另外,Llama3 8B的模型可以在内存只有8G的树莓派上运行,对于计算机资源的依赖比以往都要低,人人都可以本地部署Llama3,可应用于针对B端企业和各种场景下的自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等场景。 目前,我们主要通过微调(Fine-Tuning)来定制所需的模型。例如,Llama 3原生不支持中文,但我们可以通过微调让它支持中文。 什么是微调(Fine-tuning) ?这是机器学习和深度学习中的一个术语。它指的是在预训练模型的基础上,使用特定任务的数据集进行额外训练的过程,目的是让模型更好地适应特定的任务或问题。通过微调,我们可以调整模型的参数,使其更精准地解决特定问题。 就像一个已经非常了解世界的成年人。现在,我们需要它去学习一些更专业或更具体的知识。微调的过程,就像是对这个成年人进行一些专业培训,使其在特定领域更加精通。 为了帮助大家更好的理解什么是“微调”,我前天写了一篇轻松的入门教程《Llama3微调教程:超简单,人人都可以打造属于自己的GPT!》: 地址:https://mp.weixin.qq.com/s?__biz=MjM5NDIzOTg0Mw==&mid=2448257753&idx=1&sn=627c94e8b0d66bc9866ab4a42edaaa73&chksm=b29316d585e49fc312553b5efaca684af566be55237b8c4e2a1d9a472dd31f7ee74157c08163&token=1764237450&lang=zh_CN#rd 就算你不懂技术也没有关系,通过这个简单的Llama 3微调案例,我们可以免费体验整个大模型微调的过程。你可以学习到AI工程师是如何进行环境配置、数据准备、模型训练、模型运行、模型保存以及本地模型使用。 这对于大多数普通人来说,这是一个免费体验AI工程师工作方式的机会;如果你想转入AI行业,这也是一个很好的入门案例。 你可以通过我的微信公众号“PM熊叔”浏览。 另外在Shownots中,我列出了目前已经微调好的Llama3作品,大家如果有兴趣可以体验一下。 愿每个人都能从中受益,开启自己的AI探索之旅! 以下是一些微调的llama3的作品: llama3-Chinese-chat-8b:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b Instruct + 进行中的中文sft版本:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary 联通微调版本:https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary Openbuddy微调版本:https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary 破解安全限制系列(目前仅支持英文): Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b 聊天机器人:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b Bunny-Llama-3-8B-V(多模态图文版本):**https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V 我的公众号:
人工智能经典《苦涩的教训》聊聊背后的思考今天要介绍的这篇文章《The Bitter Lesson 苦涩的教训》是由知名计算机科学家,阿尔伯塔大学、DeepMind的神经网络专家Rich Sutton 在 2019 年发表的,主要讨论了在人工智能研究中一个重要的观察:当简单的算法能够利用大量的计算资源时,往往会胜过依赖于人类专家洞察力的复杂算法。 在回顾AI历史上一些关键进展时,Sutton指出,虽然研究人员曾多次尝试通过设计复杂且模仿人类理解的算法来提升机器学习模型的表现,但通常更简单、更基本的方法,只要能通过增加计算能力进行扩展往往能取得更佳效果。他强调了规模和算力的重要性,并认为未来的研究应该更多依赖于扩算力,而非复杂的设计。 OpenAI 在2021年的论文《神经语言模型的缩放法则 Scaling Laws for Neural Language Models》讨论了AI模型的性能如何随模型大小、数据集大小和训练计算量的规模提升而提升。 今天,在缩放法则(Scaling Laws)的加持下,简单的Transformer架构让GPT等大语言模型涌现出了“智能”,也展示出了AGI通用人工智能的可能性。 现在就让我们来读一读,回顾这篇经典文章。 苦涩的教训 Rich Sutton 2019年3月13日 我们从70年的人工智能研究中可以得出的最大教训是,利用计算的通用方法最终是最有效的,而且差距很大。其根本原因在于摩尔定律,即集成电路上可容纳的晶体管数量每隔18-24个月会翻倍,从而使芯片性能指数倍增。 大多数人工智能研究都是在假设智能代理可用的算力资源是恒定,在这种情况下,利用人类知识是提高性能的少数行之有效的方法之一,但在略长于典型研究项目的时间内,大规模的计算量又不可避免地会变得可用。 研究人员寻求在短期内实现改进,试图充分利用他们对特定领域的人类知识来节省算力成本,但从长远来看,唯一重要的是利用计算资源。这两者不必相互对立,但实际往往如此。由于对一种方法的投资存在心理承诺,我们在一个东西上花费大量的时间,就不会在另一个上花费更多时间。而且,基于人类知识的方法往往会使方法复杂化,使其不太适合利用计算的通用方法。这些案例不胜枚举,我称之为苦涩的教训。 作为人工智能研究者,我们学习这些教训是有指导意义的。下面,我们来回顾其中一些最知名的案例。 在1997年,计算机国际象棋领域见证了一个历史性的事件——计算机通过大规模深度搜索击败了世界冠军卡斯帕罗夫。当时,大部分研究者都倾向于利用人类对棋局结构的深入理解来设计算法,这一失败让他们颇感挫败。当一个相对简单的基于搜索的方法,结合先进的硬件和软件展示出惊人效力时,依赖人类知识的方法显得力不从心。这些研究人员对于“蛮力”搜索的胜利持怀疑态度,认为虽然这次有效,但它并非一种普遍适用的策略,也不符合人类下棋的风格。他们曾希望能通过更贴近人类思维的方法取得胜利,因此对结果感到失望。 计算机围棋的研究历程展示了一种类似的发展模式,但这一过程比其它领域晚了大约20年。初期,研究者们尝试通过利用人类的棋局知识和游戏特征来减少搜索需求,但随着搜索技术在规模上的有效应用,这些努力最终被证明是无效甚至有害的。同样,自我对弈的方式学习价值函数也显示出其重要性,这种方法不仅应用于围棋,在国际象棋等许多其他游戏中也同样适用,尽管在1997年首次战胜世界冠军的程序中,学习的作用不大。自我对弈不仅是学习的一种方式,它像搜索技术一样,使得可以利用大量计算资源。搜索和学习是利用大规模计算的两个关键技术,在计算机围棋和国际象棋的研究中,尽管研究人员最初依赖于人类的理解来减少搜索的需要,但最终还是通过采用搜索和学习技术取得了显著的成就。 在语音识别领域,20世纪70年代DARPA主办的早期比赛中,参赛者采用了包括人类发音知识在内的各种特定方法,例如对单词和音素的认识。相对的,一些新的统计方法采用了更多的计算,并基于隐马尔可夫模型(HMMs)进行操作。结果显示,统计方法优于那些基于人类知识的方法,这一发现推动了自然语言处理领域的重大变革,并在随后的几十年中逐渐成为主流。深度学习在语音识别中的崛起标志着这一发展方向的进一步演进。 深度学习方法较少依赖人类知识,而是利用大量计算资源,通过在庞大的训练数据集上进行学习,显著提升了语音识别系统的性能。研究人员原本希望开发出能模仿人脑工作方式的系统,并尝试将这种理念应用于他们的系统设计中,但这种方法最终被证明是适得其反,甚至是对时间的浪费。尤其是在摩尔定律推动下计算能力大幅提升并找到有效利用方式的背景下,这种做法更显得没有必要。 计算机视觉领域也遵循了相似的发展模式。在早期,研究者们试图通过识别边缘、圆柱形等广义结构,或使用SIFT特征来处理视觉信息。然而,这些方法如今已被淘汰。现代的深度学习神经网络主要采用卷积技术和某些类型的不变性处理,并且在性能上有了显著提升。 这一趋势给我们的教训是深刻的。作为一个领域,我们似乎还没有完全吸取这一教训,因为我们依然重复着相同的错误。要真正理解这些错误的诱惑,并有效地避免它们,我们需要认识到依据我们所认为的思考方式构建方法最终可能不会奏效。这是一个我们必须接受的苦涩教训。 从这些历史经验中,我们汲取了一些重要教训: 1 )人工智能研究人员经常尝试将人类的知识整合到他们的智能系统中。2) 短期内,这种方法似乎总是有益的,并且能给研究人员带来满足感,但长远来看,它可能导致发展停滞,甚至阻碍进一步的创新。3) 真正的突破通常来自于完全相反的策略,即通过扩展搜索和学习能力来充分利用计算资源。尽管成功令人欣慰,但这种成功往往带有苦涩,因为它是在放弃了受青睐的、以人为中心的方法后才实现的。 从这些经验中我们应该学习到的第一个重要启示是,通用方法的强大力量在于其扩展性,即使在可用计算资源极大增加的情况下也能持续有效。搜索和学习是目前看来能在这种环境下无限扩展的两种方法。 第二个重要启示是,关于大脑的实际工作原理的极端的复杂性;我们应该放弃试图以简化的方式来理解大脑的工作,如简单地处理空间、物体或对称性等。这些概念都是外部世界中复杂性的一部分,本质上是难以简化的。试图将这些复杂性内置于系统中是不切实际的。 相反,我们应该专注于内置能够探索并捕捉这种任意复杂性的通用方法。这些方法的核心优势在于它们能找到有效的近似解决方案,但寻找这些解决方案的过程应该是自动的,而不是依赖于我们的直接输入。我们希望人工智能代理能够自主探索和发现,就像我们一样,而不是仅仅复制我们的现有知识。将我们的发现硬编码到AI系统中,不仅限制了系统的学习潜能,还加重了我们理解这些发现过程复杂性的困难。 观点 Rich Sutton《苦涩的教训》原文到这里就结束了,我想聊聊我自己的观点和感悟: 人类总是习惯将自己对于世界的认知注入于亲手打造的系统之中,但是历史一次又一次的证明这种有效性只是短期的,从地心说到日心说,从经典力学到量子力学,从专家系统到大语言模型,当每一次科学革命到来之时,那些越是符合直觉的经典理论越是岌岌可危。 《金刚经》有云:“一切有为法,如梦幻泡影”,我们当前观察到现象和规律,可能都只是暂时的。那这个世界运转的逻辑到底是什么? 设想一下,如果你是这个宇宙的程序员,拥有无穷的时间和算力资源,你会如何设计这个世界? 智能设计论者说:沙漠中不会凭空产生精美的手表,所以精密的人体一定是被有意设计出来的。但是你作为一个想要摸鱼的程序员,其实对于细致入微的设计全宇宙中所有的生命体可能并没有太大兴趣,你只关心能否用最简单的算法让DNA持续地演化,演化出智能体,再让他们做那些你不想做的事情。 遵循“缩放法则(Scaling Laws)”依然是你最佳的选择,因为你不用操心这个宇宙的每一个角落的细节,你只要设计最基本的法则,并允许系统在这些法则指导下自我组织和进化,剩下的事情交给无限的时间和算力就好了。 正如480年前,哥白尼坚信上帝相信简洁优雅的规则,因此有了日心说:“天体运动的真实模型应该是基于数学的完美和简洁,而日心模型相比地心模型在数学上更为简洁和优雅”。 而今天,AI领域的进展告诉我们“简洁优雅的数学模型”依然有效,只要简洁的设计和上大尺度的数据训练,就能拥有强大的鲁棒性和智能性的系统。 佛法有云:“缘起性空;自见成佛”。这可能才是我们这个世界的本来面目。 欢迎订阅我的播客和知识星球。
聊聊Mixlab Node:AI时代如何重塑内容创作产品与社区生态前天,我参加了洪宇的《遇见AIer》的播客节目的录制,聊了聊ComfyUI的Mixlab Node背后的故事和AI产品经理关心的一些话题。如果感兴趣,大家可以去听下这期节目。 # 缘起 2023年10月,我和Shadow一拍即合,共同发起了“ComfyUI中文爱好者社区”,并把Mixlab Node纳入了议程。目前,社区已聚集了超过1000名ComfyUI创作者,包括行业内的ComfyUI大咖。Mixlab Node目前已获得600多个星标。 https://github.com/shadowcz007/comfyui-mixlab-nodes 我和Shadow都对AI创作工具及社区抱有浓厚兴趣。去年,我们见证了AnimateDiff和ComfyUI的崛起,并意识到国内迫切需要一个ComfyUI学习社区。这不仅为AI创作爱好者提供了一个交流和学习的平台,也吸引了一批热情的开发者和创意人才来共同开发ComfyUI的插件和工作流,这也促成了Mixlab Node的诞生。 # 社区驱动型产品 简而言之,Mixlab Node是基于Stable Diffusion和ComfyUI构建的节点工具。它的核心特色在于ComfyUI的高度灵活性,通过模块化设计让各种插件(或称为节点)能够无缝串联。这种设计使得用户可以轻松调用各类AI模型和处理模块,完成从图片生成到视频制作,甚至是接入大语言模型进行互动游戏的多样化工作流程。 ComfyUI的开放性和模块化让开源社区的开发者能够迅速整合最新技术和模型到用户的工作流中,而我们的MixLab Node就是其中之一。 Mixlab Node最大的特点就是“社区驱动开发”,在我们社群里面,开发者和创作者每天都会讨论大量的新技术动态和使用需求。我们的功能往往源自社区内部的实际反馈,确保了产品的实用性和创新性。 例如,Mixlab Node加密功能正是基于社区反馈而生。当时我们社群中的一些大佬的工作流被一些人冒名顶替,引起了社群内的广泛关注。开源并不是做慈善,一个良性的生态环境,既要开放共享又要尊重个人创作权益,这样开源才有持续发展的动力。所以我们想有些工作流只有通过原作者提供密码才能继续使用。通过这种方式,不仅可以让创作者的原创作品免受盗用,还可以让优秀的创作者更好地活下去。 相似的案例不胜枚举。Mix Node正是在这样一个开放、共享的环境中不断成长和优化的。通过与社区成员的紧密合作,形成了一个积极的、自我增强的闭环系统。这不仅推动了MixLab Node不断完善和进步,也为开源的AI创作贡献了自己的一份力量。 # JUST DO IT的开发模式 我和Shadow的首先达成的共识是,在AI时代我们必须要抛弃掉传统的思维方式。 在传统的软件和互联网产品开发过程中,从需求收集到产品发布通常需要经历多个步骤,包括需求分析、文档撰写、评审会议,以及最终的开发迭代,这一系列过程往往耗时长达数周,然而,由于AI技术快速迭代,这种模式很难跟上技术进步的步伐。 我们更提倡“Just do it”——有好的想法,那就先做了再说。我们直接从社区收集到好的创意就可以开始动手做开发,不需要给领导写报告,不需要撰写需求文档,更不需要走评审流程,做好后交给社群中的小伙伴们测试反馈。只有这样我们才能打造出更酷的节点。 另外,通过使用GPT,可以把开发的时间极限压缩。例如,我们在GPT的帮助下,只花了1到2天内完成录屏工作流的开发和上线,这放在传统企业,起码两周才能搞定。 录屏的需求的灵感来源于我们自己的创作视角的切换,我和Shadow都曾做过设计师,我们都想把自己的草图让AI重新渲染,但是主要的创作工具都在PS等传统软件上 ,因此想了个录屏功能,然后再考虑如何通过技术手段来实现。最后,我们发现录屏节点搭配LCM模型可以快速将草图变成精美的图片,这个功能出了以后,社区里面创作者也反馈非常积极,得到了很好的验证,也给我们带来了极大的成就感。 “Just Do It”模式并不完美。随着MixLab Node功能的不断丰富,产品逐渐变得庞大,这引发了关于用户认知清晰度的担忧。Shadow建议是先集中实现功能,然后再考虑精简和优化。我们最终的期望是提供更完整的软件产品体验,而不仅仅是单一功能的模块。 虽然初期采取“Just do IT”的策略有其必要性,但随着时间的推进,我们也会考虑如何降低用户的学习门槛。因此,在接下来的发展方向上,将包括开发教程和案例,帮助用户更好地理解和利用MixLab Node,同时也探索新的商业模式以确保项目的可持续性。 # AI赋能个人成长 在开发MixLab Node过程中,ChatGPT和GPT-4在提升开发效率中起到了关键作用。 我以前做过前端开发,熟悉Javascript,但是对于Python一直都是一知半解。从前要掌握新的技术领域,我通常需要购买在线课程或书籍,先自学清楚然后才能动手实践。但是今天,我们只要向AI提出功能描述,它就能生成代码。通过持续地调试和优化,我们就可以实现所需要的功能。这种方法极大地缩短了学习与开发周期,仅仅三年前,这样的场景还是难以想象的。 通过与AI工具的协作,即使是非专业程序员也能拓展自己的技术领域,提高对新技术的适应能力和问题的解决能力。 在未来,真正能够称之为“精英”的,将是那些具备鲁棒性和深刻业务理解的人。 鲁棒性也是称之为说泛化能力,是指你不会将自己限定在特定的岗位角色中。通过有效利用AI,你可以跨领域地解决问题。 此外,深刻业务理解能力也依然重要,这样你才能识别并聚焦于有价值的真问题。这样全面的技能和视野,将使你在AI时代中突破重围,不仅仅是完成别人给你的任务,而是成为解决关键问题的关键人物。 # 成为AI产品经理 首先,无论是哪个领域的产品经理,基本功是必不可少的。这包括但不限于对需求的深刻分析与洞察、对用户和产品的深入理解。这些技能对所有产品经理来说都是共通的。当然,AI领域的特殊性在于,你需要对底层的技术手段有所了解,了解它们的潜力和限制。 其次,运用AI能力不能异想天开。许多人有过高的期待,认为AI可以做到任何事,但实际上它的能力是有限的。我们需要理解这一点,并能基于此制定合理的产品策略,是AI产品经理的重要技能之一。 因此 ,产品经理需要掌握目前流行的AI工具和“提示工程(Prompt Engineering)”。因为在AI的世界里,你需要知道如何与AI进行有效地交流,才能扮演好“用户与AI之间的桥梁”。更重要的是,当AI的回答不尽如人意时,需要知道如何调整你的产品方案,让它能获得更好的结果。这背后的逻辑和优化技巧,是很多传统产品经理所缺乏的。 然后,培养自己的对社群的感知能力。AI产品的开发和迭代,往往需要用户的直接参与和反馈,需要建立和维护一个活跃的创作者社群。只有更接近用户,更好地理解他们的需求和期望,从而共同创造出更符合用户需求的产品。 AI产品经理不仅要有坚实的基本功,还要懂得如何与AI合作,如何与用户合作,搭建AI与用户的桥梁。我相信,只要你愿意不断学习、实践并保持开放的心态,你一定能在AI时代的产品管理领域中找到属于自己的位置。 # 尾声 在这个迅速变化的时代,开放的创新文化和社区的集体智慧将成为推动技术前进和个人发展的核心力量。这不单单局限于开源AI工具或社区的构建,而是关于在AI的浪潮中我们如何持续创新、适应变革,并推动个人的成长。 我们不仅需要重新审视传统的开发模式、学习方法和工作理念,还思考如何作为个体和社区共同前进。这对于任何在快速演进的世界中寻找自己定位的人来说都是深刻的思考题。 我们不仅只是学会适应,还需要积极参与到变革过程中。我们既是技术进步的贡献者,也是个人及社区繁荣发展的推动者。 欢迎加入“ComfyUI中文爱好者社区”!
AI时代,程序员会失业吗,还需要学习编程吗?最近越来越多人在问类似的问题,AI都那么厉害了,还需要学编程吗?计算机专业依然吃香吗?特别是昨天很多人看到了Devin AI,更是产生了一种“是不是程序员要失业了?”的疑问。 # AI 程序员能做什么? 就在前几天,仅仅成立两个月的公司Cognition发布了一款Devin AI 的产品。它被宣传为史上第一款AI程序员。在演示中,Devin AI拥有自己的命令行、代码编辑器和浏览器等工具,可以自己制定计划、执行任务和解决问题,它可以独立完成整个软件的开发和构建的工作。 另外,根据官方宣传,Devin甚至拥有“成长”的能力,它可以通过阅读文章,学习原先不懂的技术,还会自主寻找程序中的错误,并且进行修正。 从宣传来看,Devin要比之前Copilot类似的AI编程助手要更进一步,更像一个能够独立完成开发任务的程序员。这不仅代表着AI独立完成开发工作的可行性,也激发了公众对“AI是否能替代程序员”的讨论。 也有网友分析,其实Devin AI并没有想象中的那么厉害:首先,Devin的底层技术是基于GPT4,它的使用成本比普通程序员更高;其次,程序员的面试题并不难,ChatGPT也能胜任;还有就是执行的任务过于简单,和人类相比还是有较大差距。所以,人类程序员目前还是比较安全的。 虽然如此,但是随着大语言模型的性能越来越好,在可预见的未来,AI程序员必然将软件开发过程中起到关键性的作用。 # 有了AI还需要学编程吗? 会不会现在学了编程,以后就没用了? 我想这个问题可以类比为“有翻译软件了还需要学英语吗?”我相信很多人回答是:学习英语依然重要。 诚然,英语已经成为许多人综合素质的一部分了。翻译软件不能百分百解决我们的需求。例如,要查询最新最全的论文和资料,懂英语可以让我们无损获得原本的信息,而翻译软件只是方便我们快速的浏览和过滤信息的工具。另外,学习英语不仅仅是学习语言,也是学习一种文化和思维方式。这样我们才能更好地与世界接轨。同样的逻辑也适用于AI和编程。 首先,编程只是软件开发的一部分,编程是打开计算机世界的一把钥匙,计算机科学的复杂性远远超出了编程本身。它包括系统架构设计、网络安全、需求分析、用户体验和项目管理等诸多方面。这些综合性的知识和技能,才是软件创新基础。即使AI能够自动化编程任务,也需要人类来解决更复杂的问题,需要人类保持对行业趋势的敏锐洞察,他们需要理解业务需求,与非技术背景的团队成员进行有效沟通,确保技术解决方案能够满足业务目标。 另外,编程不仅仅是写代码,它是解决问题的一种方式,也是一种思维训练。学习编程能够帮助人们培养逻辑思维、系统思维、创新思维以及动手解决能力。这些能力在AI时代尤为重要,不仅限于技术领域,同样适用于生活的各个方面。随着技术的不断进步,新的工具和平台层出不穷,个人需要能够适应这些变化,还要能在变化中找到创新的机会。这种适应力和创新力对于个人发展、职业生涯乃至企业的竞争力都是宝贵的资产。 除此之外,编程并不是计算机学科的专利,它也是一种跨学科学习工具。在尝试解决来自不同领域的复杂问题时,编程能够通过数据分析、可视化、机器视觉和仿真模拟等技术手段,帮助整合和应用多学科知识,从而促进创新解决方案的产生。这种跨学科的视角不仅拓宽了我们的思维,也为AI程序员的任务分配提供了更加清晰的指导。让我们能够从更综合的视角理解和应用技术,进而更有效地推进项目和研究工作的进展。 其实,AI本身还有很多需要迭代的地方。例如,AI科研论文、设计AI算法、提升AI性能、定制AI模型以及AI伦理安全方面,人类依然扮演着无可替代的角色。换句话说,正是因为AI的发展,为计算机专业人才创造了更多的挑战和机会。对于准备想实现自己的想法人来说,现在是学习编程的最好时机,学习编程可以更好地应用AI的能力,帮助我们实现很多的创意和想法。 因此,面对“有了AI还需要学编程吗?”这个问题,我的回答是:绝对需要。 # 讲讲我的经历 我大学是学工业设计的,算理工科中的文科专业。原本编程这件事情对我来说是一件很有畏惧感的事情,大学仅有一门C语言差点挂科。但由于我对于互联网一直感兴趣,还有自己做产品的冲动,所以我临近毕业的时候,去学习了编程和软件工程相关知识。而之后又做了程序员、产品经理还有创业者,一路走来,有挫折也有收获。 过去,我经常刻意隐瞒自己做开发的经历,生怕别人认为我的职业定位不够专注。但是多年以后发现能帮助到我的恰恰是跨学科能力。 如果今天你是一位想自主创业的产品经理,究竟学过编程和不会编程的人在做产品方面到底有什么区别? 首先,学过技术的产品经理在理解技术层面的细节上有明显优势。能更好地与研发团队沟通,能更精确地传达需求,能更好地理解团队面临的挑战,并在技术可行性和资源分配方面做出更合理的决策。这种深入的理解有助于建立团队成员间的信任和尊重,从而促进团队合作和项目的顺利进行。在这些年里,我和大部分开发同事之间都维持着不错的关系,因为团队合作没有什么比理解更重要了。 其次,具备编程背景的产品经理在设计产品时,能更好地考虑到实现的复杂性和成本,会更重视需求价值,可以更好地制定MVP(最小化可行性产品)策略。特别在产品的早期规划阶段,你就能预见到某些功能的实现可能会遇到的技术障碍,不会把产品功能设计得过于复杂或者理想化,从而在设计上做出更加现实和经济的选择。让产品赢得了低成本地快速验证市场的时间。这种前瞻性不仅能够节省开发时间和成本,还能避免在项目后期进行大幅度的修改,提高了产品开发的效率和成功率。 再者,了解技术原理,也能够让我们更好地把控产品体验。会去主动思考影响产品体验的技术指标,不会想当然地做一些脱离实际场景的理想化的功能。通过能够更好地评估不同设计方案的技术实现难度,能在设计和功能性之间找到最佳平衡点。这样的产品经理能够推动设计和技术团队更紧密地协同工作,共同创造出既美观又高效的产品。 此外,编程经验还赋予了产品经理对新兴技术的敏感度和适应能力。AI时代,新技术层出不穷,具备技术背景的产品经理拥有较强的技术的敏锐度,能够更快地理解这些新技术如何被应用到产品中,以及它们对市场和用户体验可能带来的改变。例如,我经常会去Github上查看一些有趣的开源项目,学习一些新的技术课程,也会思考如何把它们应用到自己的项目和工作中。这种能力使得产品经理能够领导团队走在技术发展的前沿,创造出创新和有竞争力的产品。 最后,通过学习编程,我还获得了一系列强大的思维工具,包括面向对象的编程思想、设计模式、以及统一建模语言(UML)等。这些工具提升了我的逻辑思维和系统思考能力,教会了我如何将复杂问题逐步分解成可管理的小任务,帮助我们对问题进行抽象和建模,让我更好地理解事物的运转模式,从而找到机会点。这在产品规划、市场分析还是项目管理中,都极大地帮助了我。 步入生成式AI时代,大语言模型已经成了我不可或缺的助手。以往有很多灵光一现的创意,因为我的技术视野的限制而无法实现,它们最终只能沉睡在我的思绪中,逐渐被遗忘。但如今,我的一些突发奇想的灵感交给了GPT之后,它能很快地生成代码。虽然代码可能充满了错误,但GPT帮我快速拓展了技术视野,引导我去深入研究,并让我能对代码进行细致优化。例如,我在ComfyUI的Mixlab-Node的开源项目的开发过程中,有很多想法的实现就是通过与GPT协作来完成。 因此,作为一名独立开发者或产品经理,我们应当把AI程序员视作一位协作伙伴。正是因为有了它的帮助,让我们可以在实现更有趣的功能的同时,节省下更多时间,让我们可以用来考虑赚钱的事情。 # 总结 当我们面对Devin这样的AI程序员的时候,我们并不要为程序员岗位感到过于的担忧。编程将会变成像外语一样的普遍性能力,人类通过学习编程,我们可以更好地发挥机器的能力。 在AI的帮助下,越来越多的普通人可以实现自己的创意和想法,成为自己事业的掌舵人。在AI时代,必然是超级个体崛起的时代。 在传统企业管理中,员工们扮演的是流水线上的零件。但是在这个AI变革的新时代,我们不应当把自己角色局限在某个零部件上,拥有灵活的思维、开阔的视野和敏锐的洞察力显得更为重要。 只要我们把握好时代趋势,技多并不会压身。请快行动起来吧! 欢迎加入ComfyUI中文爱好者社区,ComfyUI是一套灵活的AIGC工作流搭建工具。目前我们集结了一群跨界的设计师、程序员 产品经理和创业者。我们正在探寻AI的生成技术在各行各业的解决方案,每日社群里面都会有高质量的讨论。