

- OpenAI 新模型O3猜照片地点像CSI一样强大
1. AI的“演绎推理”过程引人入胜:O3模型通过分析照片,进行假设、验证,甚至模拟人眼“放大”观察细节,展现了AI在视觉推理方面的惊人能力和类似侦探破案般的思考过程,这种互动体验具有很强的娱乐性和吸引力。 2. 照片定位技术普及带来的隐私风险:该技术轻松根据普通照片识别地理位置,凸显了个人隐私泄露的潜在风险。用户需要意识到,社交媒体分享的照片可能暴露他们的位置信息,从而可能对个人安全构成威胁。 3. AI工具集成是新的发展方向:O3模型将图像分析工具无缝融入其“思考”过程,表明AI系统正在朝着更智能、更自主的方向发展。这种集成工具的模式为AI应用开辟了新的可能性,不仅仅是简单的信息检索,而是更深层次的理解和问题解决。 4. “Zoom”功能可能具有象征意义:虽然“zoom”功能在提高精度上可能作用有限,但它象征着AI正在模仿人类的认知过程,并试图通过模拟人类的感知方式来解决问题。这种拟人化的操作具有很强的演示意义和宣传价值。 5. AI模型之间存在“抄袭”的可能性:虽然作者主要关注O3,但同时测试了其他模型如Claude和Gemini,并强调它们也都表现出相似的图像分析能力。暗示着AI技术进步迅速,但同时也可能存在技术模仿和复制的现象。
- 我们正在建造一个只为了让人点击广告的世界
* 人们担忧 AI 的方向错了,不是“终结者”,而是被算法和广告驱动、隐形操控的社会。 * 很多互联网公司本质上是收集数据、吸引注意力,卖给广告商,AI 让这个过程更高效隐蔽。 * 数字世界的“劝化架构”比实体世界更强大,算法可以为每个人量身定制“糖果”,精准击中弱点。 * 算法不仅仅推送广告,还能分析你的社交、浏览、消费记录,甚至推断心理状态,精准投放到脆弱人群。 * 推荐算法会推送越来越极端的内容,目标是让你不停看下去,增加广告收益。 * 我们该如何应对?
- 苹果调整高层重振Siri AI
1. 苹果AI战略的重大调整: 苹果罕见地调整了高管部署,将Vision Pro负责人Mike Rockwell调往负责Siri,表明苹果正试图扭转其在人工智能领域的颓势,尤其是Siri的表现不佳。这是苹果在AI领域战略方向上一次重要的转变。 2. Siri的困境与"iPhone 16"的营销失误: Siri在功能开发上遭遇严重延误,导致苹果在“iPhone 16”的营销中承诺的功能无法兑现。这不仅损害了消费者对Siri的信任,也暴露了苹果在AI技术上的短板。 3. Vision Pro的成败与Rockwell的价值: 虽然Vision Pro被认为是技术上的奇迹,但在商业上并未取得巨大成功。然而,Rockwell成功将其推向市场,并具备解决复杂问题的能力,这可能是苹果寄希望于他来重振Siri的关键原因。 4. “AI产品”的新定义与硬件AI融合的探索: 苹果开始将Vision Pro等产品定义为“AI产品”,暗示了未来AI技术将更深入地整合到苹果的硬件设备中。这可能预示着苹果将探索更多硬件与AI结合的可能性,例如具备AI功能的AirPods。 5. Giannandrea的留任与苹果的公关策略: 虽然Giannandrea被剥夺了Siri的领导权,但他仍然留在公司,负责AI研究和机器人技术。苹果此举可能旨在避免公开承认其AI战略的失败,并维持外界对其人工智能研发能力的信心。
- 商业创始人如何找到技术合伙人并发挥最大价值
* 为什么“商业创始人”在初创公司中的价值常被高估 * 技术合伙人为何更难找,而商业合伙人遍地都是 * 常见的“Alpha”心态及其对团队合作的破坏 * 想法本身并不值钱,执行才是硬通货 * 如何让自己成为技术合伙人眼中的“稀缺资产” * 用实际行动证明你的销售和客户开发能力 * “大名单”和LOI:初创阶段最有说服力的数据 * 为什么没有产品也能验证市场需求 * 搭建和维护属于你的高质量人脉圈 * 成为能推动业务前进的那个人,而不是“空想家” * 结论:用结果说话,成为能被信任的合伙人
- Darwin通知漏洞:一行代码致设备软砖并反复重启
* Darwin Notifications 是苹果操作系统 CoreOS 层级的低级进程间通信机制。 * 与 NSNotificationCenter (进程内) 和 NSDistributedNotificationCenter (进程间,带少量数据) 不同,Darwin Notifications 非常简单,每个通知只有一个 UInt64 状态值,通常用于表示布尔值 (0 或 1)。 * 发送通知使用 notify_post,接收通知注册使用 notify_register_dispatch。 * 发送或获取带有状态的通知需要先注册 notify_register_check 获取句柄,然后使用 notify_set_state 或 notify_get_state。 * 关键漏洞点: 任何进程,包括沙盒应用,无需特殊权限即可接收和发送 Darwin Notifications。API 是公开的,没有验证发送者机制。 * 利用此特性,沙盒应用可以模拟系统进程发送具有强大副作用的 Darwin Notifications,导致拒绝服务 (DoS)。 * 通过搜索使用了 notify_register_dispatch 和 notify_check 的系统进程,发现很多可以被模拟的通知。 * 一个特别的例子:发送 com.apple.MobileSync.BackupAgent.RestoreStarted 通知会导致设备进入“恢复进行中”模式,最终因超时失败并强制设备重启,仅需一行代码。 * 为了实现跨重启的持久化 DoS,利用了 Widget 扩展在系统启动时被唤醒的特性。 * 在 Widget 扩展的代码入口处调用 notify_post("com.apple.MobileSync.BackupAgent.RestoreStarted"),并让扩展随后崩溃,促使系统反复尝试唤醒。 * 结果是设备陷入反复重启的“软砖”状态,需要擦除设备才能恢复。 * 该漏洞已报告给 Apple,并分配了 CVE-2025-24091。 * 修复方法是为敏感 Darwin Notifications 引入了新的限制性 entitlement (com.apple.private.darwin-notification.restrict-post.)。 * 敏感通知的名称现在带有 com.apple.private.restrict-post. 前缀,notifyd 会检查发送进程是否拥有对应的 entitlement。 * 该 Entitlement 最早出现在 iOS 18.2 beta 2 中,并在 iOS 18.3 中完全修复了 PoC 中展示的所有问题。 * 漏洞赏金为 US$17,500。
- AI Agent 发展:定义、要素与未来方向
* Agent 的定义:让模型基于环境反馈去使用工具的一个程序。 * 这波 Agent 热与之前不同:底层模型能力(RL)、Agent 工程和产品侧突破(Context 构建)使其更有实际价值。 * Context:大模型执行任务所需的各种信息总和。Agent 的 Context 来源是自动化的,无需人工干预。 * Tool Use 方案:函数接口类:Function Call (OpenAI)、MCP (统一标准)、A2A (Google,争议较大)。 模拟人类操作类:Computer Use, Browser Use (结合视觉识别/RPA)。 两者不互斥,可结合。Browser Use 通过 GUI 交互,纯视觉方案不成熟,常需 MCP 包装 API。 国内 Open API 较少,模拟人类方式可能更依赖。AI Coding 可以提高准确率,降低幻觉。 * Browser Use 的价值:营造“可信的氛围感”,让用户直观看到 Agent 执行过程。 * Agent 会走向通用还是垂直?文锋认为将长期处于垂直 Agent 时代。 * AI Coding 和 Agent:AI Coding 是 Agent 的有力工具,但效率较低且难以协同复用,Agent 更倾向优先使用现有工具,找不到再用 AI Coding。 * RL 和 Agent 的关系:Agent 源于 RL。理解 Agent 需理解 RL 的三个要素:状态(Context)、行动(Tool Use)、激励信号(反馈)。创业公司需构建好的“环境”:清晰状态、行动空间、结果定义(激励信号)。 * Workflow 和 Agent:长期共存。Workflow (人类驱动) 稳定可靠但死板,适合日常 80% 任务。Agent (AI 驱动) 泛化灵活但不确定性高,适合 20% 开放探索任务。 * Agent 的重要交互入口:“Chat” 提供用户自由度。 * 意图识别和 Context:互为依赖。Context 越多,意图越准;理解意图后,需更多 Context 完成任务。模型应能判断 Context 是否充分并主动获取。 * System Prompt:辅助模型表现,垂直领域更有效。 * Google 的优势:海量用户点击数据,未来可用于意图识别构建 Context。 * Agent 开发者需解决的信任问题:信任大模型能力,避免退回 Rule-based。 通过产品设计(如展示推理过程)让用户信任 Agent 结果。