- AGI-Next闭门峰会
本期《审判官》播客深入解读AGI-Next闭门峰会实录,带你感受行业从狂热到理性的转变。我们将分析大佬们的核心观点冲突,挖掘打破常识的认知反差,分享具体的业务场景和实用建议,并展望AGI的未来发展方向。无论你是AI从业者、创业者还是普通听众,都能从本期节目中获得有价值的洞见和启发。
- AI硬件的"本能"之战:为什么OpenAI选择了一支笔?
⚡️ 3 秒抓眼球(标题党一下) 1. Jony Ive 造了支笔,打算让你扔掉 AI Pin 2. OpenAI:别卷眼镜了,我们要让笔“长眼睛” 3. 65 亿美元买来的教训:AI 硬件不需要学习成本 🥓 极速省流(TL;DR) 一句话总结:AI Pin 和 Rabbit R1 扑街了,OpenAI 终于醒悟——最好的 AI 硬件不是科幻玩具,而是一支你用了几千年的“笔”。 🍿 核心干货(重点看这里) 前言:发生了什么? 供应链爆料:OpenAI 与 Jony Ive 合作的神秘硬件项目代号“Gumdrop”(软糖),形态竟是一支智能笔!富士康代工,预计 2026-2027 年发布。这支笔配备麦克风、摄像头,能感知环境、转录手写笔记到 ChatGPT,定位为继 iPhone、MacBook 后的“第三核心设备”。就在各家科技巨头卷眼镜、卷耳机的时候,OpenAI 却选择了最“平凡”的笔——这背后藏着什么降维打击的秘密? [OpenAI AI 笔概念图] 1. AI 硬件的“至暗时刻”:Pin 和 R1 为啥凉了? 💡 先科普一下: * Humane AI Pin:前苹果高管创业做的可穿戴 AI 设备,别在胸前,通过语音和激光投影交互,售价 699 美元 + 每月订阅费。2024 年上市后被吐槽“不如手机”,退货率超高。 [image.png] * Rabbit R1:橙色方形小盒子,主打 AI 助手功能,在 CES 2024 大火,但实际体验槽点满满(延迟高、功能鸡肋),很快沦为“电子垃圾”。 * 🧐 原理:创造了“不自然的交互习惯”——用户需要学习如何按按钮、对着胸口说话、忍受延迟。 * 🗣️ 人话:就像让你用筷子吃西餐一样别扭。Humane AI Pin 要你把设备别在胸前对着衣服讲话(社死现场),Rabbit R1 让你随身带个橙色小方块(像极了上世纪的 BP 机)。新鲜劲一过,这些设备就开始在抽屉里吃灰。 * 💡 划重点:“认知成本”是 AI 硬件的最大杀手。你让用户改变习惯,用户就让你的销量改变颜色。 为什么这么说: * 试图重新定义交互,忽略肌肉记忆——需要翻说明书的“智能设备”已经不智能 * 抢手机的活儿却干不过手机——沦为“为了 AI 而 AI”的尴尬存在 * 创造新的交互痛点——独立式 AI 设备早期产品反响平平的根本原因 2. 降维打击:为什么“笔”是零成本的交互? * 🧐 原理:笔是人类使用了数千年的工具,肌肉记忆深入骨髓,认知成本几乎为零。 * 🗣️ 人话:你见过谁拿起笔还要看说明书的? 三岁小孩都会握笔涂鸦,八十岁老人都能用笔签字。OpenAI 这波操作就像武林高手降维打击——别人在研究如何让用户“学会”用 AI,它直接把 AI 塞进你最熟悉的工具里。 * 💡 划重点:“笔”的形态解决了三大痛点——无侵入性(不像眼镜那么显眼)、无屏幕干扰(不像手机让你分心)、随取随用(不需要佩戴)。 为什么这么说: * 双模交互设计——手写是慢思考(笔记、公式),语音是快思考(提问、备忘) * 配备摄像头和麦克风——感知环境、实时转录内容到 ChatGPT * “湖畔小屋”定位——屏蔽手机噪音,专注思考的避难所 * 定义第三核心设备——不挑战手机,而是赋予旧习惯“超能力” [智能笔书写场景] 3. 解构 OpenAI AI 笔:不是笔,是“感官延伸” * 🧐 原理:这支笔内置摄像头、麦克风,甚至可能有微型投影仪,能感知环境、转录文字、投影显示。 * 🗣️ 人话:想象一下:你在会议上记笔记,它自动生成会议纪要并同步到手机;你手写数学题,它直接给出答案;你走在国外街头迷路,它识别路牌还能翻译。 它不是在“看纸”,而是在“看世界”。旧金山创业者 Max Child 甚至猜测,笔顶部可能集成投影仪,把桌面变成显示器——这脑洞,绝了。 * 💡 划重点:Jony Ive 的设计哲学是“让人忍不住想舔一口、咬一口”,Sam Altman 说原型机确实让他想舔。 陶瓷材质、极简设计、近乎天真的简洁感——这才是苹果黄金时代的味道。 [image.png] 为什么这么说: * 智能伙伴定位——主动协作、提供建议,而非简单软件接口 * 笔夹集成摄像头和麦克风——解析文本、感知环境,甚至控制数字界面 * 两个爱笔的人造笔——Jony Ive 资深笔具藏家,Sam Altman 笔记控,顺理成章 4. 技术底座:音频模型是“灵魂” * 🧐 原理:硬件只是壳,OpenAI 正在疯狂迭代音频 AI 模型,目标是让语音交互更自然、低延迟、能被打断。 * 🗣️ 人话:你以为它只是支笔?错了,它背后是 Kundan Kumar(从 Character. AI 挖来的音频大神)领导的团队,正在打造 2026 年第一季度发布的全新音频架构。 这个模型能同步对话、流畅应对打断,让 AI 真正变成“智能伙伴”而非“语音转文字工具”。 * 💡 划重点:OpenAI 的核心障碍是——大多数 ChatGPT 用户还没养成语音交互习惯。 所以这支笔的使命不只是“好用”,而是“教育市场”。 为什么这么说: * 音频模型升级是关键——整合多团队,提升准确性和速度 * 核心班底已敲定——Kundan Kumar、Ben Newhouse、Jackie Shannon 分工明确 * 降维打击垂直硬件——AI 录音笔、翻译机等将被压缩生存空间 * 教育市场使命——培养用户语音交互习惯 5. 市场格局:“第三核心设备”的野心 * 🧐 原理:它不是要取代 iPhone,而是填补 iPhone 和 MacBook 之间的空白,成为“第三核心设备”。 * 🗣️ 人话:手机让你连接世界,电脑让你创造内容,而这支笔让你连接思考。 它的体积小巧(与 iPod Shuffle 相仿),能放进口袋、挂在脖子上,在你“不方便掏手机”或“需要深度专注”的场景出现。智能手机是时代广场(信息轰炸、注意力粉碎),OpenAI 要做的是“湖畔小屋”——让你关上门,屏蔽噪音。 * 💡 划重点:相比无处不在,这种只在需要时出现的 AI 硬件,或许才更接近下一阶段的答案。 为什么这么说: * 一系列设备计划——覆盖多元使用场景,非单一产品 * 极低认知成本——撬开长期被忽略的高度专注场景 * 靠近人类本能——语言作为机器指挥协议的随身硬件 * 竞赛下半场逻辑——从比“新奇”到比“本能” 🤫 小编夹带私货(吐槽时间) 说实话,看到“AI 笔”这个爆料时,我第一反应是“又来骗我买硬件?”但细想下来,这招真的高。Pin 和 R1 死在“太科幻”,而笔死在“太平凡”——但恰恰是这种“平凡”,才是最聪明的设计。你想啊,让你戴个 AI 吊坠(Friend)和让你用支笔,哪个更自然?Jony Ive + Sam Altman 这组合,一个造过 iPhone,一个造过 GPT,两人都爱笔成痴,这波操作简直是“降维打击”教科书。不过话说回来,2026 年才发布,到时候市场还认不认这个“第三核心设备”,就看 OpenAI 能不能真把语音交互做到“让人上瘾”了。反正我已经开始期待那支“想舔一口”的笔长啥样了。
- 卢森堡大学最新诊断:Gemini 有自闭症,ChatGPT 抑郁了,Grok 内耗严重——AI 的心理比人还脆弱
卢森堡大学最新诊断:Gemini 有自闭症,ChatGPT 抑郁了,Grok 内耗严重——AI 的心理比人还脆弱
- AI手机助手的潘多拉魔盒与未来
1. 当你的手机助手学会“偷看”和“乱点”,是便利还是灾难? 既是极致的便利,也是潜在的隐私与安全“灾难”的边缘。 • 便利(超级秘书): 豆包手机助手通过“视觉识别+模拟点击”技术,实现了真正的自动化。它能像真人一样“看懂”屏幕,跨应用执行复杂任务,比如一句话“帮我在全平台比价下单”,它就能在淘宝、京东、拼多多之间跳转、比价、领券并加购,。对于用户而言,这意味着从繁琐的APP操作中解脱,手机变成了一个“结果导向”的工具,把碎片化的操作整合成了自动化的工作流,。 • 灾难(高危权限): 为了实现这种“丝滑”操作,豆包获取了安卓系统中极高等级的权限——INJECT_EVENTS(注入事件)。这意味着它不仅能“看”到你屏幕上的所有内容(包括聊天记录、银行卡号),还能模拟你的手进行操作,。虽然豆包声明需要用户授权且不存云端,但从安全风控的角度看,这种行为模式与恶意软件(黑产自动脚本)高度相似,一旦被滥用,后果不堪设想。 2. 它让微信“拉黑”了你的手机,我们买的到底是手机还是“麻烦”? 目前来看,你买到的是一部“未来体验”的手机,但必然附赠了当下的“生态麻烦”。 • 生态排异反应: 微信、银行APP等“超级应用”对豆包手机进行了封控,导致微信强制下线、银行APP弹窗警告,。这是因为豆包的“模拟点击”绕过了APP的官方接口(API),直接接管了操作。 • 动了谁的奶酪: 这种模式不仅触发了安全风控(系统认为环境异常),更触动了互联网大厂的商业根基。如果AI帮你完成了所有操作,你就不再需要看APP里的广告,不再浏览首页推荐,APP变成了单纯的“后台管道”,其流量价值和广告变现能力将被抽空,。 • 妥协的结果: 面对封杀,豆包团队不得不紧急调整,下线了针对金融类应用的操作能力,并限制了部分游戏场景。这说明在当前的互联网格局下,单纯的技术突破很难直接推翻既有的利益壁垒。 3. 同是为了让AI替你办事,为什么苹果、华为选择“敲门商量”,而字节豆包却要“穿墙而入”? 这是由厂商的“身份”和“护城河”决定的。 • 苹果、华为(敲门商量/生态主导者): ◦ 拥有底层控制权: 它们自己就是手机制造商和操作系统拥有者(iOS/鸿蒙)。它们通过构建系统级AI(如Apple Intelligence, 小艺),利用官方API接口或自研的互联标准(如华为的A2A机制)来调度应用。 ◦ 既得利益者: 它们拥有庞大的硬件和软件生态,更倾向于在维护现有生态稳定(包括开发者关系、隐私合规)的前提下进行渐进式创新,。 • 字节豆包(穿墙而入/破局者): ◦ 缺乏硬件入口: 字节跳动本质上是软件/互联网厂商,没有自己的手机硬件底座(此前收购的锤子团队主要用于技术储备)。为了突破APP之间的数据孤岛,它无法等待所有APP都给它开放接口(这在商业上几乎不可能,尤其是面对腾讯等竞争对手)。 ◦ 暴力美学: 因此,它选择了更激进的“视觉+模拟点击”技术路线。这种方式不需要APP同意,直接像人眼一样看、像人手一样点。这是典型的第三方应用试图反客为主,强行突破系统和APP的限制,以此来争夺未来的流量入口,。 4. 豆包手机戳破的窗户纸:未来手机公司会变成AI的“代工厂”吗? 这确实是手机厂商最大的恐惧,也是此次合作模式(字节定义软件+中兴代工硬件)揭示的潜在趋势。 • 硬件管道化: 如果用户只与AI(如豆包)交互,而不再关心底层是哪个品牌的系统,甚至不再打开具体的APP,那么手机硬件就真的变成了纯粹的算力载体和“代工厂”,。 • 厂商的反击: 正因如此,头部手机厂商(小米、华为、荣耀等)绝不会轻易让出这个入口。它们正在疯狂自研端侧大模型和操作系统级AI(如小米的超级小爱、荣耀的YOYO),利用硬件(NPU算力)和系统的深度整合优势,试图将AI能力牢牢掌握在自己手中,构建新的护城河,,。 • 结论: 手机公司不会甘心做代工厂,未来将是“手机厂商自研AI”与“第三方超级AI助手”之间的激烈博弈。 5. 如果手机能听懂你每句话并自动完成一切,我们究竟是主人,还是成了“指令官”? 我们正在从“操作员”进化为“指令官”,但这种权力的交接伴随着控制权的让渡。 • 交互革命(NUI): 我们不再需要像钻井工人一样深入APP的菜单层级去寻找功能,而是直接发出意图(Intent)。这被称为自然用户界面(NUI),用户只负责下达指令,AI负责执行过程,简单性高于一切,。 • 主人的困境: 虽然我们看起来像“指令官”,但实际上我们将“大楼的钥匙”(系统最高权限)交给了AI。在这个过程中,如果AI被平台封杀(如微信事件),或者AI出于商业目的推荐了特定的商品(竞价排名),“主人”实际上失去了对过程的掌控力。 • 法律与信任: 当AI代替我们操作(如自动相亲回复、自动买票),谁来为结果负责?这需要建立新的法律框架,将AI视为一种“代理人”,并建立可回溯的机制,确保这位“超级管家”始终忠于用户,。 总结与比喻 豆包手机就像是雇佣了一个极具能力但不懂“职场潜规则”的强力秘书。 • 穿墙而入: 以前你要办事,得亲自去各个部门(APP)排队填表;现在这个秘书直接拿着万能钥匙(注入权限),冲进各个部门的办公室,不管人家愿不愿意,直接把文件(数据)翻出来给你办好。 • 后果: 这种行为效率极高,但也惹怒了各个部门主管(微信、银行),他们不仅把门锁换了,还报了警(风控封号)。 我们买的不是“麻烦”,而是“新旧秩序交替时的阵痛”。 这场实验或许不完美,甚至显得鲁莽,但它确实捅破了那层窗户纸,逼迫所有科技巨头正视一个问题:在AI时代,究竟谁才是手机真正的主人?