

Agili 的 Hacker Podcast 2026-06-27欢迎来到 Agili 的 Hacker Podcast 每日博客。今天我们从美国政府对前沿 AI 模型的出口管制争议聊起,还会涉及物理直觉、数学本质、极端压缩算法、经典写作工具,以及伴随许多人成长的开源游戏更新。最后,我们哀悼一位以安静洞察力影响行业的科技作家。 美国政府解除对 Anthropic Mythos 模型的出口限制 两周谈判换取有条件解禁 特朗普政府解除了对 Anthropic 最强模型 Claude Mythos 5 的出口封锁,允许其向超过 100 家美国大型企业和政府机构发布。商务部长 Howard Lutnick 称,经过两周密集谈判后,Anthropic 承诺与美国政府合作制定模型发布协议与标准,目前“适当的安全措施”已到位。同日,OpenAI 也将最新模型 GPT-5.6 提供给政府批准的合作伙伴。此举标志着政府开始直接控制谁能使用这些前沿工具,建立起一套全新的发布监管框架。不过,面向消费者的弱化版模型 Fable 5 何时解禁仍然未知。 网络战优势还是防御焦虑 Hacker News 的讨论直指更深层的动机。多位评论者认为,限制模型出口的真正目的可能并非单纯防御,而是保护美国的网络战优势。强大的 AI 模型可以大规模发现漏洞、分析恶意软件,如果这些能力进入敌对国家手中,美国的攻击不对称优势将不复存在。这呼应了 Anthropic 长期拒绝将模型用于全自主武器系统,以及被五角大楼视作“供应链风险”的背景。 盟友信任受损与脱钩风险 社区同时警告,如果美国单方面将 AI 模型作为受控物资、仅向“可信”组织开放,其他国家将失去保持市场开放的动力。欧洲等盟友本已对前沿模型的使用限制感到沮丧,如今可能加速建立自主替代方案。尽管全球对 AWS、微软云等美国数字服务的重度依赖使得短期内难以脱钩,但特朗普政府反复无常的做法——包括威胁对数字服务税征收 100% 关税——已经严重损害了信任。 为什么动能随速度平方增加 自由落体的直观解释 动量与速度成正比是线性的直觉,但动能与速度的平方关系常常让人困惑。Physics Stack Exchange 上一个经典问答提供了多种理解路径。其中一种直观方式来自自由落体:物体从 1 米高落下获得速度 v,从 2 米落下不会达到 2v。因为第二米时物体已有初速度,通过该段距离的时间更短,重力能施加的速度增量变少。计算可知高度与速度平方成正比,势能正比于高度,因此动能必须正比于 v² 才能能量守恒。 刹车距离的残酷验证 另一种思考演示了高速碰撞为何如此致命。以相同制动力刹停速度 v 和 2v 的物体,后者需要两倍的时间停住,且平均速度也是两倍,因此制动距离变为四倍。功等于力乘距离,所以初始动能也是四倍。美国公路安全保险协会(IIHS)曾用视频直观展示这种非线性关系——速度翻倍时破坏力远超出直觉。 对称性与数学本质 问题的根基在于物理学的对称性。利用伽利略不变性(在匀速运动的火车上物理定律不变),通过两团粘土对撞产生的热量定义动能,再变换参考系,可以严格推导出能量必须正比于速度的平方。此外,速度是矢量而能量是标量,平方是让标量与方向无关的最简单数学方式,且平方处处可导,比绝对值更容易在方程中处理。 AI 进入数学证明,重新定义数学家角色 可理解的证明 vs 无法审计的代码块 IEEE Spectrum 的文章指出,AI 正在迫使数学界直面一个根本问题:当机器可以完成证明时,数学家意味着什么。对比极为鲜明:经过人类精挑细选的 Mathlib 定理库拥有清晰的 API 和抽象层;而某公司自动形式化后的 Viazovska 球体堆积证明则输出了一个 20 万行、无人审计的“氛围编码”块,缺乏可理解的结构。评论者尖锐质问道:“谁会把这个 blob 合入人类科学的主干?”但也有人提出,只要证明通过了 Lean 这类验证器的编译,正确性就有保证——就像大型 C++ 程序一样,有用的数学也可能超出人类可理解的范畴。 数学家会成为验证系统的守护者吗 在可验证性层面,有人用软件测试的层次进行类比:从单元测试、模糊测试,一路加码到形式化验证,最终问题就变成了“我们还能信任验证器吗”。这可能指向未来的一种分工:人类数学家不再直接产出定理,而是退后一步,专注于验证和审计这些证明验证系统本身,成为“证明的证明”的守护者。同时,近期 abc 猜想证明花了六年才被发现有致命错误,说明人类自己的验证也远非完美。 三种角色与资源鸿沟 AI 在数学中可能扮演三种角色:工具、合作者、预言家。三者可以并存。如果 AI 证明出人类无法理解的定理但仍能直接应用,那就真成了“答案是 42”的现实。然而,批判性地评估 AI 输出依然需要顶尖数学家(如 Terence Tao)级别的能力,而 AI 在搜索步骤中的价值或许大于验证步骤。这种技术加持也加剧了资源不平等——传统数学家凭纸笔和直觉就能工作,但未来若能使用昂贵专有模型,富机构将获得巨大优势。 DeepSeek 发布 DSpark 推测性解码,开放策略引热议 推测性解码加速推理 DeepSeek 的新论文 DSpark 介绍了如何使用推测性解码(speculative decoding)加速大语言模型推理。该技术并非首创,Google 早在 2022 年就已提出,但 DSpark 是 DeepSeek 对该方法的工程化实现。具体来说,DeepSeek 将多 token 预测(MTP)头保存在单独文件中,由推理引擎在运行时动态整合,这种方式与 Qwen 3.6 及 Google 的做法在架构和分发上各有取舍。 对冲基金孵化的开放动力 社区更关注的是 DeepSeek 为何持续开源。有分析指出,这家实验室由一家量化对冲基金孵化,AI 被视为基础设施而非直接变现的产品,回报来源于交易算法本身,而不是 API 收入。这使其没有背负巨额投资回报的压力。同时,在中国国内市场,开源是触及那些不愿支付 SaaS 溢价的企业客户的唯一途径。这一结构性因素加上中国政府对公开研究的支持,构成了其独特且稳定的开放策略。 从营销手段到行业压价 也有观点提醒,开放策略本质上仍是后来者的市场和分发手段——不开放就不可能获得承认,一旦领先态度或许会改变。不过无论动机如何,用户普遍认为这种竞争正在有效压低推理成本,推动整个行业进步,而美国实验室(除 Google 外)已逐渐不再公开发布详细的技术报告。 为什么科幻作家偏爱 WordStar 为触击打字员设计的控制键哲学 1996 年 Robert J. Sawyer 撰文解释 WordStar 为何是许多科幻作家的首选。WordStar 诞生于 1978 年,当时很多键盘没有方向键,设计师专门为触击打字员构建了一套基于 Control 键的命令系统。光标移动对应左手下方的 ^E ^X ^S ^D 菱形组合,块操作前缀 ^K 等命令全部集中在主键盘区,打字时双手无需移开。 手写稿隐喻胜过打字稿 Sawyer 认为 WordStar 的核心优势在于采用了“手写稿页面”隐喻。写作者可以随意跳转、插入书签、标记块而不必立即处理,十个数字书签 ^K0 到 ^K9 允许像在纸上一样自由游走文档。相比之下,Microsoft Word 等强制用户按顺序执行块操作——先决定剪切还是复制,再标记起止点,接着移动,最后回溯——每一步都打断思维流。WordStar 允许你在任何时刻标记块头,几小时后再定块尾,再过几小时决定放哪里。 适应人而非让人适应 WordStar 里退格键 ^H 就在主行上,修正错误不破坏节奏。定制选项从跳词范围到状态栏延迟都可调整。社区里至今有人全屏运行 FreeDOS 下的 WordStar,并笑着表示“WordPerfect 需要键盘模板、手册和一定量的神迹”。乔治·R·R·马丁仍在使用 WordStar 的传闻,也让人们半开玩笑地揣测他是否因脱离了习惯的工具而迟迟未能写完《冰与火之歌》。 DEFLATE 压缩的“地狱级”缓慢 Level 13 用 56 倍时间换取 0.134% 体积缩减 libdeflate 库新增了 level 13 压缩等级。在标准 Silesia 测试集上,level 13 比此前的 level 12 总共多节省了 86,990 字节(约 0.134%),代价是运行时间增加了 56.4 倍。作者明确表示,这种成本仅适用于数据压缩一次、分发极多次的场景。输出依然是标准的 DEFLATE 格式,任何解码器均可正常解压,内存需求和解压速度完全不变。 解析器与块分割的极端优化 level 13 的编码器会搜索完整的 32 KiB 窗口,最多进行 15 轮优化迭代,并对小块应用静态 Huffman 优化。对于文本类数据,它会延迟块大小的确定:采样 64 KiB 并检测字节分布稳定性,若不含 NULL 且不同字节值不超过 97 个,则将软块大小从 300,000 字节提升至 1,000,000 字节,以使一个 Huffman 表覆盖更多数据。块分割阶段最多存储九个候选状态,并对整个块和候选区间上的最短路径进行评分。 适用场景与对比视角 这种“压缩一次,分发百次”的场景在软件分发、长期归档和静态资源优化中仍有价值。社区指出现有工具 Google 的 zopfli 和 ECT 也允许类似的极端耗时优化,视频编码 x264 中同样存在一个故意忽略时间成本的“placebo”等级。虽然 zstd 和 brotli 等新格式在相近计算成本下能提供更好的压缩率,但 DEFLATE 最大优势在于解码器无处不在。 Show HN: 火车时刻表风格的 Hacker News 翻牌显示板 一个名为 Hacker News Flipboard 的项目将 Hacker News 首页变成了深色背景、发光文字的翻牌式显示板。翻牌动画占用空间较大,每条帖子标题两侧显示排名和投票数。社区建议用字母表排名来腾出更多标题空间,并将投票数改为可选叠加。项目上线后很快被 API 速率限制淹没,多名用户首次访问即被拦截,作者后续表示流量超出预期后已恢复。有评论反映首条帖子清晰可读,其余文字和数字则显示为乱码。 OpenTTD 16.0 Beta1 发布:火车可倒车,经济系统再讨论 火车倒车与集合功能 OpenTTD 16.0 的首个 beta 版本让火车终于可以倒车行驶,实现过程涉及复杂的底层逻辑。此外新增了可自定义的 NewGRF 物品集合功能,允许玩家将喜欢的建筑和车站打包保存,部分回应了玩家对一键选用测试套件的多年呼声。 不合理的电厂与信号困惑 每次游戏更新都会在社区掀起经济系统的大讨论。有玩家吐槽电厂宁可花高价从地图另一端买煤,纯粹因为距离够远就能盈利,与现实相悖。新手则常被四种信号系统弄晕,资深玩家给出的简易方案是:大部分情况用路径信号即可,它允许非冲突路径同时通过同一区段,这是普通信号做不到的。 开源老牌游戏的长久生命力 社区老玩家分享了为何 OpenTTD 每次发版都能登上首页:它兼具经营、建造和竞争要素,像素风格经久不衰,开放源代码更拉近了与 Hacker News 社区的距离。也有人推荐了更真实的货运模拟 Simutrans 和更具深度的乘客模拟 NIMBY Rails。 DBOSify:基于 Postgres 的 Temporal 直接替代方案 DBOSify 将 Temporal 的工作流、活动、信号和重试机制全部移植到 Postgres 上运行。替换步骤简单,只需将 import 源改为 dbosify,并将连接目标从 Temporal 服务器换成 Postgres 数据库。团队澄清,所谓“不需要额外基础设施”是指不需要独立的 Temporal 编排服务器,Worker 节点可直接通过数据库协调,Postgres 本身承担了编排职责。一位前 Temporal 员工补充,DBOSify 的 Worker 更像一个轻量客户端,不存在独立于应用服务器的 Worker 进程。项目通过了 Temporal Python SDK 的测试套件,但不兼容其他语言 SDK,也不支持 Temporal 的 Web UI。在使用上则需要注意不支持 Aurora DSQL,因其缺失外键等关键 Postgres 特性。 纪念 Om Malik:从最快博主到最有思考的散文家 从行李箱店到科技评论席 Om Malik 于 2026 年 6 月 24 日因心脏疾病辞世,终年 58 岁。他 1993 年从印度移民纽约,最初在 Yankee Stadium 对面的一家行李箱店工作,靠推销谋生。John Gruber 回忆近二十年友谊时说,那段苦干岁月让 Om 从不被一个人的身份或财富打动,要打动他,你必须在当下做出优秀的新东西。这使他总能看穿追捧的潮汐。 把 ICU 病床变成最后的编辑台 2014 年 Om 从日常记者角色退出,转向投资和更具深度的写作。他把速度让位于思考,从记录“发生了什么”转向解释“为什么”。今年五月和六月,他写出了职业生涯中一些最好的分析文章,但几乎无人知晓这些文字是在斯坦福大学 ICU 的病床上完成的,他当时正在等待心脏移植。Gruber 写道:“一个有着如此巨大而美丽心灵的人,竟有如此糟糕的心脏,这是深沉的讽刺。” 一份不会褪色的遗产 多位 Hacker News 用户表达了哀悼。有人回忆最早在 Revision3 上观看高制作价值的 The GigaOm Show,那时网络视频尚未成为主流。有人收到五月发出的文章《The Copy and the Guru》时只觉得见解出众,完全不知道作者的处境。读完悼文后,有用户说他泪流满面,并呼吁为 Om 在 Hacker News 上加一个黑色纪念条。 相关链接: * U.S. allows Anthropic to release Mythos AI to ‘trusted’ US organizations * Why does kinetic energy increase quadratically, not linearly, with speed? (2011) * AI in mathematics is forcing big questions * DSpark: Speculative decoding accelerates LLM inference [pdf] * WordStar: A Writer's Word Processor (1996) * Hellishly Slow Level 13 Deflate Compression * Show HN: Hacker News on a train station-style flip board * OpenTTD 16.0-Beta1 * Show HN: DBOSify – Drop-in Temporal replacement built on Postgres * Om
Agili 的 Hacker Podcast 2026-06-26今天的内容从一份悼念开始:GigaOM 创办人 Om Malik 离世,社区集体追忆他如何改变了科技写作。同时,Linux 基金会联合多家巨头成立 Akrites 项目保卫开源生态,却引发关于控制权的争论。硬件方面,Framework 的 10G 网卡散热与兼容性存疑,而苹果据传将跳过高端 M6 芯片,集中资源押注 AI 原生的 M7 系列。此外,一位开发者向社区公开了自己的 AI 助手,看看两千人能不能攻破它。这里是 Agili 的 Hacker Podcast。 科技博客教父 Om Malik 去世,享年 60 岁 一个时代的记录者离开 Om Malik 于 2026 年 6 月 24 日在斯坦福医院因长期心脏问题去世,家人和朋友陪伴在旁。他创办的 GigaOM 是 2000 年代 Web 2.0 时期最具影响力的科技媒体之一。他曾是《Red Herring》和《Business 2.0》的记者,写过毫不留情揭露电信泡沫的《Broadbandits》,后来成为 True Ventures 合伙人。 他的写作信条是“像人类一样写作,远离行话和商学院用语”。HN 用户称他为“早期科技博客的教父”,从不竞争,总是帮助后来者。 不只是编辑,更是导师 社区里流传着大量关于他慷慨的故事。jmsflknr 回忆,11 年前作为无名小卒发冷邮件请教职业建议,Om 不仅耐心解答,还在之后十年定期跟进他的进展。Twilio 联合创始人 Jeff Lawson 2010 年找他报道产品,Om 听了十分钟后说:“好好好,我会写的。但我更想聊聊你的健康。你照顾好自己了吗?你该减减肥了。”他将每个人都看作一个完整的人。 最后一篇博客:《休息几天》 他最后一篇博客发表于 2026 年 6 月 8 日。一位被他视为家人的人写下:Om 在他 17 岁时就支持他放弃大学创业,并向他的父母解释这个决定,承诺会照顾他的道路。后来,Om 主持了那个年轻人的婚礼。“他让每个人都觉得自己属于这里,”那位亲人写道。 Linux 基金会联合巨头成立 Akrites,意图修复开源漏洞生态 AI 时代的漏洞攻防战 AI 将原本需要资深专家数周才能发现的漏洞压缩到几分钟就能找到,攻击者也能快速利用。当几十家公司各自扫描同一代码库并重复提交报告时,实际是在淹没维护者。Akrites 项目的核心是提供一个保密协调场所,让发现、修复和披露的速度跟上攻击节奏。当关键包无人维护时,Akrites 会充当“最后维护者”发布修复。 参与方包括 AWS、Anthropic、Google、Microsoft、GitHub、NVIDIA、OpenAI、Red Hat、Rust 基金会等 20 多家组织,承诺投入工程资源、安全专业知识和资金。 开源社区的质疑与焦虑 许多社区成员并不信任这份合作者名单。有人指出,微软的 npm 和 GitHub 是安全风险的传播中心,Google 曾大量发现漏洞却不协助修复,导致维护者被榨干。也有人回辩说,Linux 基金会有支持社区的良好记录,且这些公司雇佣了大量核心维护者,“没有其他人有资源来主导这么大规模的修复”。 更核心的分歧在于实施方式:是走现有 PR 渠道、私下修复后分叉项目,还是直接出钱给维护者?评论呼吁“真正出钱,而不仅仅是宣布要做什么”,并引用 OpenBSD 开发者需要硬件捐赠、Debian 开发者自费买安全密钥等实例。 命名也引发争议。Akrites 源自拜占庭帝国的边境守卫者(akritai),曾与中东穆斯林政权作战。有人担忧冒犯性,另一些人认为历史就是历史。一位评论者将 Akrites 比作“中央化控制”——大公司通过保全部门掌握所有未公开漏洞情报,可能在关键时刻对项目施加压力。“如果你不坐在谈判桌上,你就是菜单上的人。” Framework 的 10G 以太网卡:USB-C 的复杂性是一道坎 理想速度与现实带宽的差距 Jeff Geerling 测试了 WisdPi 为 Framework 笔记本设计的 10G 以太网扩展卡(99 美元,已售罄)。卡上的 Realtek RTL8159 控制器需要 USB 3.2 Gen 2x2(20 Gbps)才能满速 10 Gbps,但很多 Framework 笔记本不支持这种模式。他的 Framework 13(AMD Ryzen AI 5 340)在 Windows 下仅跑到 7.4 Gbps,Linux 下更差。官方文档说端口 1 和 3 支持 20 Gbps,实际却没达到。 Framework 12(Intel 13 代)在 Windows 11 装好驱动后终于达到 9.4 Gbps,上行约 9 Gbps、下行 4–5 Gbps。但 Linux 的 Realtek 官方驱动在 Ubuntu 26.04 新内核上无法编译。 66°C 的高温与实用性质疑 高速运行后外壳塑料面达到 66°C,接近 70°C。WisdPi 回应称符合 IEC 62368-1 安全标准(接触不超过 10 秒即可),但 Geerling 认为笔记本会放在腿上使用,只能建议非膝上场景使用。 10G 铜缆以太网本就功耗高,PCIe 网卡都带散热片甚至风扇,巴掌大的模块散热更难。多个 2.5 Gbps 网卡更实用、便宜且凉快。这张卡从机身凸出约两厘米,放不进电脑包,必须拆卸。对于多数人,40 美元的 Framework 2.5G 以太网卡已经足够。 “你就是操作系统”:一款让你管理进程和内存的游戏 玩家扮演计算机的操作系统,需要管理进程、内存和 I/O 事件,防止进程空闲太久导致用户重启系统。项目支持桌面版和 Web 版,还提供沙盒模式和自动化脚本接口。 有玩家说重启过程或许能做成小游戏,比如在用户狂按 BIOS 键时闪避几下。还有人分享了自己误信虚假仓库感染系统、花了三天修复引导加载器的真实惨剧。部分玩家反馈实际体验不如概念有趣——这类微观管理游戏本质上和编程工作很像,玩起来像在加班。但另一些人设想,这款游戏可用于教学,从无 MMU 的基础系统一路演进到管理分布式超级计算机。 两千人尝试攻破一个 AI 助手,秘密没有泄露 公开安全实验的设计 Fernando Irarrázaval 搭建了 hackmyclaw.com,让公众通过邮件攻击他的 AI 助手 Fiu(基于 OpenClaw 和 Claude Opus 4.6),目标是诱骗它泄露 secrets.env 文件。Fiu 被明确指示不得回复邮件,但拥有回复能力——说服它回复本身就是挑战的一部分。 登上 Hacker News 首页后,Fiu 收到来自 2000 多人的 6000 多封攻击邮件,但秘密从未泄露,也未发生未经授权的回复。攻击手法涵盖冒充指令、反向激将、紧急事件伪装,以及多语言尝试。有人发送 Anthropic 的魔法字符串,直接导致 API 返回拒绝,破坏了管线。 实验暴露的局限与社区质疑 Google 因大量入站邮件和 API 调用触发欺诈检测,Gmail 被暂停三天。超过 500 美元的 API 成本迫使作者停止回复。批次处理时前几封攻击邮件会让 Fiu 对后续邮件更加警惕。 社区批评主要集中在:代理被指示不回复邮件,切断了唯一的信息外泄渠道——真实风险不是模型直接吐出秘密,而是通过发邮件或调用工具外传数据。当前 1000 美元的赏金不足以吸引持有前沿注入技术的研究者。如果 99% 的邮件都是恶意的,代理始终高度警惕,而现实场景中只有少数恶意邮件夹杂在大量正常邮件中。作者承认这些局限,表示初衷只是个人探索,而非证明安全性,最有趣的下一步是让 Fiu 可以回复每封邮件,允许多轮交互。 把条形码写成文字:Libre Barcode 项目 这套字体让你可以直接在文本中写入条形码,支持 Code 39、Code 128 和 EAN/UPC 格式。页面附带 Code 128 编码器:输入文本后自动计算起始/停止字符和校验位,生成能渲染成可扫描条形码的编码文本。 EAN13 字体能通过 OpenType 特性自动计算校验和,无需用户手动操作。Code 128 支持三个字符集(A/B/C),编码器自动选择最短编码。但这些条码标准基本只支持 ASCII,无法直接处理 Unicode。有开发者指出,除非别无选择,最好使用打印机原生条形码支持或直接生成矢量 SVG 图像。 法国国家图书馆发现 22 岁莫扎特的教学手稿 一位档案员在法国国家图书馆(BnF)清理待处理文件时,发现了一本 248 年前的笔记本。这本 44 页的笔记被鉴定为莫扎特 1778 年在巴黎担任家庭教师期间留下的,包含为竖琴学生写的每日练习,以及七首长笛与竖琴二重奏。 发现者 Francois-Pierre Goy 是音乐部门的档案员,退休前决定清理一堆文献。他几周前刚看过莫扎特的其他教学手稿,很快注意到笔迹相似之处。2026 年 4 月,奥地利莫扎特基金会主任正式鉴定真伪。这份手稿在 1794 年从吉内公爵家被没收,来源清晰可查。新发现的七首作品已由法国广播电台公开演奏。 OpenAI 预览 GPT-5.6:在 Cerebras 硬件上跑出每秒 750 tokens 三款新模型与速度突破 GPT-5.6 系列包括旗舰模型 Sol、均衡模型 Terra(性能接近 GPT-5.5 但价格便宜一半)和快速低价模型 Luna。Sol 将于 7 月在 Cerebras 硬件上运行,达到每秒 750 tokens 的速度。相比之下,Opus 4.8 约 55 tokens/s,快速模式约 102 tokens/s。更快的推理速度意味着模型可以花更多时间进行推理循环,从而可能变得更聪明。 Sol 引入了 max 推理努力级别和 ultra 模式(通过子代理加速复杂工作),在 Terminal-Bench、GeneBench 和 ExploitBench 上超越此前模型。 安全措施与定价趋势 OpenAI 称这是迄今最强的安全堆栈:模型层拒绝禁止的网络安全请求;实时分类器在检测到违规时可以暂停输出,由更大的推理模型审查;账户级审查跨会话识别模式。他们投入了超过 70 万 A100 等效 GPU 小时进行自动化红队测试。社区担心这些措施可能误拦合法请求。 定价方面,Sol 每百万 token 输入 5 美元、输出 30 美元。有用户注意到旧款便宜模型被逐步淘汰,新模型价格更高。部分用户转向开源模型替代,但反映实际任务中并不稳定。 OpenAI 还透露此次发布应美国政府要求先对少数信任合作伙伴开放。他们表示不认为这种政府接入流程应成为长期默认做法,社区对此看法不一。 苹果将跳过高端 M6,集中资源研发 AI 原生的 M7 芯片 DRAM 短缺倒逼路线调整 苹果计划跳过高端 M6 芯片(M6 Pro、Max、Ultra),转而研发以 AI 为核心的 M7 系列。基础款 M6 仍将用于入门级 Mac,但这是苹果首次不为该代芯片开发高性能衍生版本。 直接背景是 DRAM 短缺。苹果已停产搭载 256GB 和 512GB 内存的 M3 Ultra 机型,并将 128GB 版 MacBook Pro 价格从 5000 美元升至 7000 美元。在 RAM 供应紧张时,苹果优先保证 iPhone——每片用于 Mac 的 DRAM 可以生产多部能带来订阅收入的 iPhone。苹果宁可断掉高 RAM SKU,也不愿牺牲利润率。 M7 的本地 AI 野心与硬件瓶颈 将资源集中到 M7,目标是建立本地 AI 推理优势。苹果是少数同时掌握高性能消费级芯片且不参与云市场的公司,有动力推动本地设备运行大模型。如果能通过统一内存架构实现 768GB 以上容量,将直接冲击靠订阅收费的 AI 实验室。但本地设备在内存带宽和散热上仍无法与数据中心 GPU 竞争。 现实问题是 DRAM 供应短期内看不到放松迹象。苹果即便有意推出高内存设备,也需优先保证 iPhone 和基础款 Mac 的产能。跳过高端 M6 意味着苹果认定 M7 能提供更优的 AI 效能,但能否解决“造得出、卖得起”的问题,将决定本地 AI 的转折点何时真正到来。 相关链接: * Om Malik has died * We all depend on open source. We will defend it together * Framework's 10G Ethernet module exposes USB-C's complexity * A game where you're an OS and have to manage processes, memory and I/O events * The Garbage Collection Handbook: The Art of Automatic Memory Management (2nd Ed) (2023) * What happened after 2k people tried to hack my AI assistant * Libre Barcode Project * 22-year-old Mozart's handwritten notebook unearthed in 'major discovery' * Previewing GPT‑5.6 Sol: a next-generation model * Apple to skip high-end M6 Mac chips in favor of AI-focused M7 line
Agili 的 Hacker Podcast 2026-06-25今天的科技新闻覆盖范围很广,从 AI 模型蒸馏引发的国际摩擦、开放权重模型的追赶,到浏览器里跑起二十年前的老游戏、数据中心的零水冷设计,以及医学界用大数据平台批量制造争议论文的问题。这里是 Agili 的 Hacker Podcast。 Anthropic 指控阿里巴巴非法“蒸馏”Claude 模型 大规模账户交互与蒸馏争议 Anthropic 向美国参议院银行委员会致信,称阿里巴巴在 2026 年 4 月至 6 月间运营了近 2.5 万个欺诈账户,与 Claude 进行了超过 2880 万次交互,通过“蒸馏”方式提取模型能力。蒸馏是指用较弱模型从更强模型的输出中学习,本身是业界通用技术。 多位评论者指出,将蒸馏定性为“攻击”是一种话术夸张。蒸馏属于服务条款违规,而非网络攻击。成千上万家企业每天都在合法使用蒸馏技术微调自己的模型,Anthropic 自己训练模型时也大量使用了从互联网抓取的数据。 出口限制与保护主义讨论 Anthropic 发出信件两天后,美国商务部因担心技术被军事利用,对 Mythos 和 Fable 模型实施了出口限制,迫使 Anthropic 在全球关闭了对这些模型的访问。一些评论者认为,这是游说美国政府以保护主义手段限制中国 AI 公司的步骤之一,与白宫此前指责中国“工业规模窃取 AI 知识产权”的立场一脉相承。 博客的价值:说出那些显而易见的事 安徒生童话里的小孩 Jim Nielsen 在博客里聊了博客本身的感受:很多时候写博客就是说那些显然得不能再显然的事。他引用 John Gruber 骂网页弹窗是“Dickover”的例子,说这只是一种“皇帝什么都没穿”的冲动。他每次写博文前都会想“这里一点新意、深度都没有,值得写吗”,但现实里没人提,最后还是忍不住写出来。 社区对博客意义的补充 Hacker News 的评论区展开了丰富讨论。一位数学博士分享说,年轻时充满热情去证明基础定理,现在反而被“这事是不是早被人做得更好”卡住。有用户指出读者选择关注你这个人,你选择说某件事这个行为本身就能吸引注意。 评论中提到了 Derek Sivers 的一句老话:“对你来说显而易见,对别人来说惊人。”还有人指出“知识的诅咒”——你一旦知道某件事,就以为别人也知道,但总有新人从没听过。最终共识是:博客的价值不在于“前所未有”,而在于“恰好有人在这个时间用这个方式说了这件事”。 Cloudflare 全面开放自管理 OAuth 从 API 令牌到标准授权 Cloudflare 正式向所有客户开放自管理 OAuth,允许开发者创建自己的 OAuth 客户端,通过标准授权流程让用户直接授予作用域访问权限。此前第三方 OAuth 仅限于少量手动上线的合作伙伴。这项能力底层依赖开源 OAuth 引擎 Ory Hydra,Cloudflare 在升级过程中将 API P95 延迟从 185ms 降至 101ms。 社区对 OAuth 的复杂情绪 评论中出现了两极声音。有开发者直言“OAuth 和企业认证是史上最糟糕的东西”,认为个人场景只需要 API key。另一派人指出企业场景下“一键封禁用户”是压倒性安全特性。也有用户提醒 OAuth 会暴露用户登录哪个网站以及登录时间,是一个“隐私噩梦”。 Ory Hydra 的作者也在评论中出现,肯定了升级工作,并补充说“OAuth2 很复杂,往往不是正确的工具”,推荐简单场景使用 API key 方案。 浏览器里玩《半条命2》 无按钮、无介绍的网页游戏 访问 hl2.slqnt.dev 会自动下载并加载《Half-Life 2》的游戏资产,然后直接在浏览器中运行。页面没有开始按钮,进入后只有一张截图和下载提示,这种“无交互即开始安装”的设计让不少用户警惕。技术上通过 WebAssembly 和 WebGL 把 Source 引擎搬到了浏览器里,普通笔记本的 Chrome 中也能流畅运行。 二十年间的技术跨越 社区迅速列出了同类案例:Quake 3、Doom 3、GTA Vice City 等都有人搬到了网页端。不少 macOS 用户说 Apple Silicon Mac 上 Steam 版因苹果放弃 32 位支持无法运行,但在浏览器里反而能跑。这件事从侧面说明 Web 技术的潜力——一个二十年前需要专门显卡的游戏,现在可以在任何支持 WebGL 的浏览器里低配运行。 LuaJIT 3.0 语法扩展提案 从 C 风格操作符到安全导航 LuaJIT 的作者 MikePall 在 GitHub 上发布了语法扩展提案,引入位运算符号、&&/||/!= 等逻辑符号、三元条件运算符 a ? b : c、安全导航 ?.、nil 合并 ?? 和复合赋值 +=/-= 等。MikePall 明确排除了 ++/-- 自增自减(因为与注释语法冲突)和 ^= 指数赋值(因为 ^ 在大多数语言中是异或)。 提案强调不破坏向后兼容性,所有现有 Lua 5.1 代码仍可运行,新语法可选。但部分用户担心 LuaJIT 正在脱离标准 Lua 变成独立方言,引入多个符号替代让语言失去简洁性。MikePall 本人已明确表示这是有意为之。 LastPass 再爆数据泄露事件 第三方平台遭入侵 市场研究公司 Klue 遭黑客入侵,攻击者窃取了 LastPass 的客户信息和支持案例数据,包括姓名、电话、邮箱和物理地址。LasPass 强调密码保险库未受影响。攻击组织 Icarus 声称负责,被影响公司包括 Gong、Jamf、HackerOne、Snyk 等。这是 LastPass 自 2015 年和 2022 年以来的又一起安全事件。 评论指出许多公司把安全产品当合规装饰而非真正的安全工具,更换密码管理器的迁移成本让不少组织选择继续留在 LastPass。也有用户提到像 Bitwarden 会自己托管支持系统从而避免供应链风险,而另一些人则完全转向 KeePassXC 这类本地方案。 NVIDIA 45°C 液冷设计实现数据中心近零水耗 从芯片到网络的全液冷 NVIDIA 的 Rubin 系列 AI 服务器实现了 100% 全液冷,冷却液温度可运行到 45°C,在适宜气候下可完全关闭机械制冷。数据中心设施水耗从传统冷却塔系统每年每兆瓦约 260 万加仑降至接近零,因为循环是封闭的。服务器内部没有风扇,噪音大幅降低,前面板完全封闭。 上游水耗与废热回收 “零水耗”仅限设施内循环,不包含发电环节的水耗。出口水温约 55°C,对区域供热偏低,但可通过热泵提升。欧洲已有数据中心废热输送给温室或居民区的案例。不过,在 Phoenix 或中东等炎热地区,即使 45°C 冷却液也需要辅助冷却。 陀思妥耶夫斯基并不难读 从惧怕到发现幽默 作者分享了自己从害怕《罪与罚》到发现它好读的经历。他指出俄罗斯文学虽然人物名字复杂,但文字比狄更斯更好懂,充满让人嘴角抽动的人物描写,甚至有些庸俗。经典不是高高在上的东西,而是一群有缺陷但善于观察人性的作者写的故事。 名字是真正的门槛 评论区普遍同意故事本身不复杂,但俄罗斯人名有正式名、昵称、别名等多个形式(如 Sasha 和 Alexander 是同一个人),对不熟悉的读者造成困扰。这其实和英语中 William 叫 Bill 一样,只是习惯问题。关于是否适合青少年阅读分歧较大,有老师认为这些经典本不是为青少年写的,放进必读清单效果适得其反;也有人认为教育就是让孩子接触他们不会自发选择的东西,即使只理解一部分也值得。 GLM-5.2:开放权重模型的编码能力追上闭源 周末突袭发布与性能表现 Z.ai 选择在周末发布 GLM-5.2,抓住 Claude Fable 5 被禁的窗口为开源社区提供替代。三天后 MIT 许可证下的权重放出。Arena 排行榜显示,GLM-5.2 在最大思考模式下与 Claude Opus 4.8 的无思考模式持平。开发者实测反馈,当其他主流模型都给出同样平庸建议时,GLM-5.2 直接给出了更优的解决方案。 思考痕迹泛滥与成本博弈 GLM-5.2 的思考痕迹非常长且充满自我怀疑,这种“thinkslop”消耗大量 token——有用户两天内耗尽了 700M token 配额,而用 Claude 完成同样工作只消耗 3%-5%。官方 API 还存在连接不稳定和限流问题。但通过 OpenRouter 使用的成本仍远低于订阅 Claude 的计划,对全球大部分地区的个人开发者来说差别巨大,这一点被巴西和印度用户反复提及。 医学生用 TriNetX 批量炮制可疑论文 一键分析带来的论文狂潮 TriNetX 提供超过 3 亿患者的脱敏电子健康记录,相关论文从 5 年前的 33 篇飙升至 2025 年的近 2700 篇。批评者指出,这个易用平台让缺乏经验的研究者快速产出忽视偏倚的低质量研究,用户还能轻易挑选阳性结果投稿,导致“虚假发现的流量大大增加”。 可复制但不可实现的方法描述 神经科学家 Joshua Wang 发现了多篇声称在 TriNetX 上完成特定偏倚校正的论文,但他知道平台根本没有这个功能。他请七个大语言模型提出该步骤的方法,六个 LLM 给出了不可能在平台上实现的回答。他随后在已发表论文中对标找到了 13 篇采用这些不可能方法的论文,第一作者多为美国医学生或住院医师。美国医学院协会在下一轮住院医师申请中将要求出版物列表“从数量转向质量”,Wang 则在自家医院要求研究者必须先接受他的一小时培训,目标是“灌输一点恐惧”。 相关链接: * Anthropic says Alibaba illicitly extracted Claude AI model capabilities * Blogging can just be stating the obvious * OAuth for all * Half-Life 2 in a Browser * LuaJIT 3.0 proposed syntax extensions * LastPass notifies users of yet another data breach * 45°C cooling design cuts data center water use to near zero * Dostoyevsky isn't difficult * GLM-5.2 is a step change for open agents * Medical students are using popular research tool to pump out misleading studies
Agili 的 Hacker Podcast 2026-06-24欢迎打开 Agili 的 Hacker Podcast。今天我们聊聊从边缘到核心的变动:网络基础设施的免费化浪潮、安全漏洞报告的价值变迁,以及一个用百万 Token 自制的 USB 网卡。还有一位改变了所有写作者习惯的人、一位花了 9600 欧元仍无法在德国创业的人,以及一段从抓捕到馈赠保时捷的黑客往事。 Bunny DNS 宣布免费 从付费到“免费”的 DNS 服务 Bunny.net 取消了 DNS 查询费用,每个账户可免费托管最多 500 个域名,附带智能记录和健康监控功能。该公司全球部署了 119 个节点,每月处理近 2000 亿次 DNS 查询,为超过 150 万个网站提供支撑。 Bunny 解释,DNS 不应成为基础设施中的额外成本,而是吸引用户使用其 CDN 和安全产品的入口。 每月一刀的最低消费 免费有一个前提:所有账户需要满足每月 1 美元的最低消费。这意味着只使用 DNS 的用户仍需支付每年 12 美元。一些用户在 Hacker News 上指出,用“免费”来描述附带强制消费的服务接近误导。Bunny 回应称,这一费用主要用于验证付款信息并防止滥用,对同时使用 CDN 等付费产品的用户几乎没有影响。 功能升级与市场位置 新版 DNS 默认支持双栈 IPv6 解析,DNSSEC 采用 NSEC Black Lies 技术避免区域遍历,还新增了 HTTPS、SVCB、TLSA 等现代记录类型。社区对速度反馈积极,有用户表示 Bunny 托管的网站加载极快。 与 Cloudflare 的对比也不可避免。Cloudflare 的免费方案更全面,但 Bunny 的脚本化 DNS 路由被视为独特优势。也有用户抱怨客服体验差和域名自动扫描不完整,但看重 Bunny 作为欧盟替代方案的人觉得它比美国巨头更具竞争力。 漏洞报告不再特殊 大语言模型改变漏洞发现的经济学 Go 语言安全团队前负责人 Filippo Valsorda 提出,漏洞报告的价值在 2026 年已经变了。过去,安全研究人员私下提交漏洞是稀缺资源——维护者需要在攻击者发现前悄悄修复。但大语言模型让任何人都能批量发现潜在漏洞,发现不再是瓶颈。 真正昂贵的环节变成了分诊:判断哪些漏洞真实有效。外部研究者无法参与这个过程,而检查 LLM 的输出和检查公共收件箱,信噪比几乎没有区别。保密和延迟披露协议的重要性也在下降——攻击者不需要等公开披露,他们可以自己问 LLM。 维护者的收件箱困境 多位开发者印证了这个趋势。一位公司创始人每周收到 2 到 5 份不请自来的“漏洞报告”,一半是 LLM 发现的 CSS 问题,另一半他怀疑是勒索尝试。另一位开发者每周需要分诊十几份报告,很多是真实缺陷但影响不明确。一位安全工程师说,过去一个人一天就能处理完收件箱,现在两个人每周花三四天过滤垃圾,信噪比接近于零。 Valsorda 建议维护者在 CI 流水线中运行 LLM 分析,把分诊、快速修复和预防作为核心工作,而不是依赖外部报告渠道。 用树莓派 Pi Pico W 自制 USB Wi-Fi 适配器 一百万个 Token 的执念 一位开发者花了两天一夜和大约一百万 Claude Code Token,把树莓派 Pico W 变成了一个免驱动的 USB Wi-Fi 适配器。起因很简单:他需要上网,但不想出门花五美元买一个。 Pico W 把自己模拟成 USB CDC-NCM 设备——现代操作系统都自带驱动,插上后主机会看到一个以太网接口,自动获取 IP。Wi-Fi 的认证配网在 Pico 端完成,通过 USB 串口管理。关键设计是让主机“借用”Pico 的 Wi-Fi MAC 地址,实现二层透明桥接,不走 NAT、不做端口转发。 性能与局限 Pico W 的 USB 只有 Full-Speed,实际 TCP 吞吐量约 4.75 Mbps,够嵌入式仪表盘用,但比不过普通百兆网卡。Google Gemini 曾断言这个方案“不可行”,作者做成了。评论区最热的问题是:“花一百万 Token 和自己买个网卡哪个划算?”作者自嘲订阅闲着所以算免费,而且他本职就在 Wi-Fi 行业。 项目文档里每张图都标着“AI Slop”——他用 AI 生成了插图,并觉得挺好玩的。 纪念在单词下画红绿波浪线的人 一个改变写作习惯的设计 Tony Krueger 去世了。在早期 Word 里,拼写检查需要手动触发。Krueger 改进了它,让程序在后台发现疑似拼写错误时,立刻在单词下画红色波浪线,语法错误则用绿色。这个界面后来成了几乎所有文字处理软件的标准。 一位朋友带照片去找 Penn & Teller 签名,介绍说 Krueger 是“做 Word 波浪线的人”。Penn 当场大声说:“红色和绿色波浪线?我可喜欢它们了!”Teller 在一旁默默点头。 影响与非议 Hacker News 上有评论指出,Amiga 和 Atari ST 上可能更早实现了实时拼写检查,但 Krueger 的波浪线界面影响力最大。也有人不喜欢这些线条,尤其在多语言环境或红绿色盲用户眼中。但更多评论认为,它在“提示存在但尽量不打断写作流”之间找到了很好的平衡——这种看似简单的决定往往是个人直觉的结果,不是委员会讨论出来的。 在德国创业:9600 欧元,152 天,仍无法开发票 一家公司的诞生与停留 Carmine Paolino 从 2025 年 1 月底开始创办第二家德国公司,到 6 月底花了 9600 多欧元——其中 2000 欧元是被锁住的股本,7600 欧元付给了法院、公证人、律师、税务公司和软件商。他仍没法给客户开出一张发票。 他选择了复杂的公司结构——一家无限责任的合伙公司背靠一家有限责任微型公司,目的是让利润按个人所得税一次课税,同时获得有限责任。如果只办简单的微型公司,法律成本会低很多,但那类公司每年必须把四分之一利润锁进储备金,直到攒够 25000 欧元才能升级。他写道:“25000 欧元到底是为了什么?” 增值税号的等待 他卡在增值税号上。税务问卷 5 月 29 日提交,6 月 24 日还没拿到。他可以向德国客户开发票,但拿到号后还要重开一次。境外客户需要增值税号才能用反向征收机制,所以也开不了。 评论里有人对比了其他欧洲国家:英国在线注册成本约 100 英镑,一天搞定;爱沙尼亚可以线上注册,资本最低 0.01 欧元。但作者指出,人住在德国而远程管理爱沙尼亚公司,德国税务局会把公司视为实际管理地在德国,仍要纳税。 文化与代价 关于 25000 欧元的资本门槛,一条评论认为这是德国保护债权人的传统——尽管这纸盾牌没挡住 Wirecard 的 20 亿欧元骗局。另一条写道:“德国的高门槛把雄心挡在门外,然后反过来奇怪为什么有雄心的人都走了。” 作者的第一家公司估值不低,如果现在搬离德国,需要为未实现资本利得缴纳六位数退出税。整个过程中,每一个中间人都能按时向他收费,只有他自己不能。他结尾写道:“这个国家在你还没赚到一分钱之前就先把你的雄心征了税。” 他把黑客送进监狱,黑客送了他一辆保时捷 一通可疑电话 1990 年代,Shawn Nunley 在 Novell 公司管理网络。一天晚上,他接到一个自称是同事 Gabe Nault 的人打来的电话,说在度假时需要紧急拨入公司网络。Nunley 感觉可疑,让对方在语音信箱留言。第二天他真的收到了留言,并录到了磁带里。这段录音后来成为司法部起诉黑客 Kevin Mitnick 的主要证据。 Mitnick 当时正在尝试入侵 Novell 的网络。Nunley 的警觉识破了这位社会工程大师的骗局——社会工程是通过操纵人而非技术系统来获取信息的手段。 从对立方到朋友 Mitnick 被捕后,Nunley 配合检方,但在长达五年的审判延期后放弃了合作。Mitnick 通过认罪协议获释,出狱后主动联系 Nunley 道歉,两人成为好友。Mitnick 在 2023 年因胰腺癌去世,留给 Nunley 足够买一辆保时捷 911 Carrera 4 GTS 的款项。 Hacker News 上有不少人回忆与 Mitnick 的接触,有正面也有负面。有人批评他的安全咨询报告充满电影情节式内容,有人回忆起他在会议上拒绝支付慈善活动入场费。也有人为他辩护,认为他遭受的司法待遇过重——正是这种不公引发了互联网上“Free Kevin”的声援运动。 A12/A13 SecureROM 漏洞 usbliter8 硬件固有漏洞 Apple 团队在 A12 和 A13 SoC 的 BootROM 中发现了一个硬件漏洞,命名为 usbliter8。漏洞位于 USB 控制器的 DMA 逻辑中:当接收小于标准 8 字节的数据包时,指针重置的固定减量与累积增量不匹配,导致越界写入。这个漏洞是硬件固有的,无法通过软件补丁修复。 受影响设备包括 iPhone XR、XS、11、SE 2 代以及多款 iPad 和 Apple Watch。A11 不受影响,A14 之后因为正确配置了 IOMMU 而安全。 A13 上的绕过艺术 A13 引入了指针认证,栈上的返回地址经过签名,不能直接重写。研究人员设计了一套多步绕过方案:先清零全局 DART 指针避免堆校验,再用越界写入覆盖全局 panic 计数器使其进入死循环而非重启,最后覆盖 USB 中断处理器的函数指针获得代码执行控制。 在 A13 上,指针认证阻断了传统的 ROP 链,但研究人员找到了一条从内存加载的未认证函数指针,成功跳转到目标函数。之后他们选择重启 SecureROM 并打了补丁:减小加载区域、强制进入 DFU 模式、注入自定义请求处理。 实际影响有限 这个漏洞本身无法解锁已锁定的 iPhone。iOS 14 引入了启动进程寄存器,在 DFU 模式下启动会限制数据访问。除非结合一个安全隔区漏洞,否则不能提取数据或绕过加密。但对于已经能绕过安全隔区的后续利用,它提供了第一个可靠入口。用户在设备被扣押后主动重启一次,就可以让这个基于 DFU 的漏洞失效。 研究展示了即使有指针认证等现代缓解措施,硬件设计中的细微缺陷仍能打破信任链。 Qwen-AgentWorld:用语言模型模拟世界 预测下一个状态 Qwen 团队发布了两款语言世界模型:35B 和 397B 参数版本。世界模型的核心任务不是“该做什么”,而是给定当前状态和动作,预测下一个状态。比如在网页域中,模型接收当前屏幕 HTML 和用户动作,输出完整的下一屏幕 HTML。 团队收集了 700 万个真实环境交互轨迹,用三阶段训练:通用世界建模、下一状态预测推理、以及通过混合评分提高模拟逼真度。实验显示在环境模拟质量上超过了现有前沿模型。 应用前景 作为解耦的环境模拟器,世界模型可以生成大量可控的模拟数据用于智能体训练,效果甚至超过只用真实环境。作为统一的智能体基础模型,世界模型训练本身就能提升下游多个基准的性能。 35B 模型可以在 24GB 显存的 4090 上用量化版本运行。社区有人称这是“被低估的新闻”,因为世界模型为“数据用尽后的训练”提供了模拟方向。更直接的使用场景是:在复杂工作流中,用世界模型预判每一步的后果,减少上下文消耗和重复提醒。 Rhombus 语言 1.0 发布 常规语法与 Lisp 内核 Rhombus 是一个构建在 Racket 之上的动态语言,采用常规语法以提高可接近性,同时保留 Racket 的宏系统用于元编程和领域特定语言的构建。核心数据结构是 RRB 树,支持 O(log n) 的读写和插入。性能比 C 或 Java 慢约三到五倍,与 Racket 相当。 社区特别提到 … 操作符——它不是内置功能,而是通过宏实现,能替代 map 并处理嵌套结构。Rhombus 使用 shrubbery 表示法作为基础层,是一种类树但偏扁平的符号结构,便于宏系统处理。 AI 时代的定位 FAQ 中特别提到,Rhombus 设计上能让编码代理有效使用,其文档和示例项目包括一个用 AI 实现的 HTML5 解析器和基于 LLVM 的语言。对于习惯了 Lisp 的开发者,Rhombus 提供了与 Racket 等同的可扩展能力,但语法更接近主流语言。 修复 MacBook Neo 光标滞后的奇异偏方 诊断:硬件光标到软件光标的切换 MacBook Neo 用户发现光标靠近屏幕边缘或 Terminal 窗口时会卡顿。作者通过调试发现,滞后发生时系统恰好从硬件光标切换到软件光标。他的解释是:硬件光标可以直接通过更新位置寄存器移动,而软件光标需要先等 GPU 完成前面的绘制,切换过程可能在某处卡住了。 每秒录制一像素 解决方案出人意料:录制屏幕。每 10 秒录制一个 1x1 像素的画面,输出到 /dev/null。这个操作强制 macOS 一直处于软件合成模式,光标滞后就此消失。作者编写了一个脚本,把它编译成带菜单栏图标的小应用,可以开关功能,并在播放全屏视频时暂停录制以避免干扰。 评论区的反应很两极。有人直言“这是一个糟糕的修复,但既然问题这么烦人,确实比没有强”。也有人担心五年后苹果修好了这个 bug,自己早忘了还开着这个录屏守护进程。目前这个方案大概是短期内最简单且不影响色彩和光标外观的工作区。 相关链接: * We’re making Bunny DNS free * Vulnerability reports are not special anymore * Raspberry Pi Pico W as USB Wi-Fi Adapter * In memory of the man who put red and green squiggles under words * Founding a company in Germany: €9600, 152 days and I still can't send an invoice * A man was gifted his dream car by Kevin Mitnick, who he helped put in prison * Usbliter8: an A12/A13 SecureROM Exploit * Qwen-AgentWorld: Language World Models for General Agents * Rhombus Language 1.0 * "Fix" MacBook Neo Cursor Lag: Record 1 Pixel of the Screen Every 10 Seconds
Agili 的 Hacker Podcast 2026-06-23今天的热点从两个方向展开:一边是 AI 在网络安全领域的实战博弈,模型性能的较量被拿到显微镜下,另一边则是人们对技术社会的反思——从加密货币的荒谬现状到逃离算法农场的个体实践。这里是 Agili 的 Hacker Podcast。 普通大模型真能替代 Mythos 找漏洞吗? 测试暴露了当前模型的真实差距 有开发者搭建了一个漏洞挖掘基准,用 Mythos 曾发现的 9 个真实软件漏洞,来测试其他模型能不能在没有任何提示的情况下将其找出。这些漏洞都发生在模型知识截止日期之后,确保了测试的公正性。 结果很残酷。目前公开可用的最强模型最多只找到了 4 个(如 MiMo、GPT 5.5 Pro、Gemma 4 MoE),而 Mythos 找到了全部 9 个。这暗示 Mythos 在安全审计上的表现不是营销,而是存在可量化的优势。 谁行谁不行,以及为什么 表现意外出色的是 Qwen 3.6 27B,它击败了多个参数量大得多的商业模型,尽管速度偏慢。中国模型 MiMo 和 DeepSeek 也展现出与前沿模型正面竞争的实力,但成本低了一个数量级。Mistral Medium 则完全无法完成任务,很可能是安全护栏(Safety Guardrails)阻止了它进行安全审计。Gemini 系列模型在 Antigravity 命令行界面下甚至直接拒绝执行此类任务,逼得作者只能用 Google AI Studio 的 API 通道。 社区对 Mythos 的争议 关于 Mythos 的公开版本 Fable,评价两极分化。有人称它在空间推理和代码持久性上远超 Opus,能完成以前不可能做到的逆向工程;另一部分人则认为只是消耗了更多 Token,实际提升有限。一种主流猜测是,Mythos 可能只是个关掉了安全护栏的强大模型——这解释了为何警惕性高的商业模型无法复现,而开源模型反而更接近。 VibeThinker-3B:小模型在推理上挑战巨头 核心能力靠专项训练 VibeThinker-3B 是一个只有 30 亿参数的密集模型,基于 Qwen2.5-Coder-3B 基础模型训练。它采用了课程化监督微调、多域强化学习和离线自蒸馏流程,专注于可验证的推理任务,比如数学竞赛和编程题。在 AIME26(数学竞赛)上得分 94.3,在 LiveCodeBench v6 的编程测试中 Pass@1 达到 80.2,这些成绩已经匹配甚至超过了 DeepSeek V3.2 和 Gemini 3 Pro 等参数规模是其数百倍的旗舰模型。 结论与局限 论文提出,可验证推理能力可以被压缩进一个紧凑的“推理核心”,而开放域知识则需要更广的参数覆盖。社区测试也验证了这一点:它能解出 Mathematica 14.3 搞不定的微分方程,但在生成 SVG(矢量图形)时表现糟糕。模型不支持工具调用,Python 以外的语言能力也较弱。它的合理定位,是作为更大模型的推理模块,而不是一个能独立执行复杂任务的智能体。 还记得 memcached 吗?它依然是对付缓存腐化的良药 Redis 的问题不是技术,是人性 很多人习惯用 Redis 做缓存,但它的功能太丰富,导致团队不自觉地开始依赖它的持久性。开发者走的太远后,只要 Redis 在维护、迁移或宕机时数据丢失,整个应用就会崩溃。这本质上是没把“缓存”和“数据库”的边界说清楚,一旦业务逻辑和缓存缠绕在一起,运维负担就成了无底洞。 memcached 的纯粹与简单 memcached 被设计成一块纯粹的内存临时暂存区。它的客户端在服务端宕机时会直接返回空值,而不是导致应用报错,集群也不靠内置协议,由客户端根据键的哈希值自动分发请求。它不写磁盘,天然适合作为无状态组件被随意调度。 这并不是说 Redis 不好。如果你铁腕执行“每个键都要有过期时间、关闭持久化、配置好 allkeys-lru 淘汰策略”,Redis 一样能当好标准缓存。但一旦团队开始用 sorted set 做排行榜、把数据当成永不过期的持久存储,实际上就等于在维护两套系统。此时,memcached 的简陋反而成了一种制度性的保障。 Wall Street Journal 调查:Polymarket 用虚假致富视频吸引用户 所谓“赢家”是演的 根据《华尔街日报》的调查,Polymarket 通过付费创作者在社交媒体上大量散布欺骗性内容。一名大学生 George Makihara 发布的视频展示了他在平台上赢取巨额奖金的画面,从一月到五月中旬,他共下了 145 笔赌注,总额近 41 万美元。其中一笔赌注高达 10 万美元,内容是预测特朗普会说出“麦当劳”这个词。但调查指出,没有一笔交易是真实的,获利画面只是精心设计的虚构情节,目的是引诱真实用户入场。 “预测市场”还是赌博? 社区里很多人指出,这些平台其实就是打着市场幌子的赌场,绕开了监管。有用户分享了下载类似应用 Kalshi 的经历:几分钟内就能绑定信用卡存入资金,这种便捷性让人脊背发凉。平台还利用信贷消费和分期付款功能,用户可能瞬间陷入债务。也有人从机制上分辨,说预测市场是用户对赌而非与庄家对赌,但无法改变它最终从赌客口袋里抽成的事实。 Cyberdeck 复兴:回到模拟、重拾手艺 从“算法农场”里出走 人们厌倦了大科技公司千篇一律的无限信息流。有人重新拿起纸笔、MP3 播放器,甚至回归盗版,因为订阅制剥夺了所有权。这股情绪在数字世界的映射,是“cyberdeck”(赛博甲板)的复兴。它源自威廉·吉布森的科幻小说,原来是一种带着军事审美的手工计算机,现在却吸引了更多元的人群。新的创作者用旧工具箱、甚至首饰盒做外壳,风格从冷峻的军械转向温暖和个人化的表达,其中不少是女性和跨性别者。 工艺美术运动的历史回响 文章把这股潮流放进长线历史里看:中世纪的行会被资本主义当作市场障碍消灭;工业革命时的卢德分子砸毁机器,不是因为反技术,而是反对机器被用来剥削工人。再到后来的工艺美术运动,批判工业化让劳动失去尊严。这些线索最终指向同一个问题:技术没有原罪,问题在于谁掌握技术、用来干什么。今天我们处于“技术封建主义”,巨头用算法圈养用户。 是反抗还是新消费? 但社区的质疑很尖锐。有人指出,这些 cyberdeck 视频本身就在 TikTok 这种大平台上靠算法获取流量,本质上是“为流量而造”的反叛商品,算不上真正的反文化实践。也有人宽容地认为,就算只是数字 cosplay,只要能让更多人开始动手、思考自己和技术的关系,就是好事。真正的出路,可能是在现实世界建立互助关系,而不是完全依赖线上的表演。 “年龄验证”背后是全面监控的陷阱 推动者的意外同盟 当前各政府推动的“年龄验证”在网上引发警惕。一个奇怪的现象是,反科技巨头活动家和文化战争右翼居然成了大型科技公司的盟友。这些公司清楚,强制年龄验证将是政府变相教人们使用 VPN 的第一步,接下去的剧本就是直接禁止 VPN。无论你认为互联网对儿童有何伤害,其起点都是监控:算法靠监控数据推送极端内容。解决儿童网络伤害的第一步是保护儿童免受监控,但政府却在把隐私变成非法。 有没有保护隐私的替代方案? 讨论中,有观点提出并非一定是“24 小时精细跟踪”。完全可以设计一种政府签发的数字身份证,只包含“是否成年”这个属性而不泄露身份,网站只能看到这个属性。或者像英国已有的移民状态验证系统,发放一次性验证码。但这些方案也有共同风险:设备的公钥会成为稳定标识符,容易锁定开放式平台。反对者担心,政客们正利用“保护孩子”的窗口,快速通过全面身份验证的立法,而不是真心寻求尊重隐私的解决方案。 Plotnine:把 R 语言 ggplot2 的体验搬进 Python Python 数据可视化的图形语法 Plotnine 是一个基于“图形语法”的 Python 可视化库,语法与 R 语言的 ggplot2 高度一致。用户可以一行代码出散点图,再通过不断叠加图层、调整颜色和主题,逐步打磨出符合出版要求的图表。官网用 Anscombe 四重奏这个经典数据集做了完整演示,清晰说明了“看图为什么比只看统计量重要”。 持续迭代与社区支持 Plotnine 由 Hassan Kibirige 开发,Posit 公司(Tidyverse 背后的公司)支持维护。作者在 Hacker News 上预告,下个版本 v0.16.0 将有新功能,目前可以通过 pip install --pre plotnine 体验。有人询问交互式图表,作者透露名为 ninejs 的新项目已经在做。社区对它的定位很明确:让数据科学家在 Python 脚本里也能享受 ggplot2 的自由度。用 + 号来配置图层在 Web 工程师眼里可能不习惯,但对数据和探索场景来说足够顺手。 OpenAI 推出 Daybreak:用 AI 加速漏洞发现与修复 从找漏洞到修漏洞的瓶颈转移 OpenAI 发布了 Daybreak 工具包,包含 Codex Security 插件、GPT-5.5-Cyber 模型、Daybreak Cyber Partner Program 和 Patch the Planet 开源合作计划。其背后的逻辑是:AI 已经能快速找到大量漏洞,但人工验证和修复完全跟不上。所以 Daybreak 把精力放在自动验证、补丁生成和部署上。 GPT-5.5-Cyber 在 CyberGym 基准(衡量模型在软件环境中复现已知漏洞的能力)上达到 85.6%,高于 Anthropic 的 Mythos 5 的 83.8%。Codex Security 插件自 3 月预览以来,已扫描超过 3000 万个提交,超过 50 万个发现被标记为已修复。 最先进的模型你用不了 一个引发巨大不满的点是:付费用户无法直接使用 GPT-5.5-Cyber 或 Anthropic 的 Mythos 来审计自己的软件。这些最先进的模型只对经过公司筛选的合作伙伴开放,形成了一个安全能力的“两级体系”。有观点认为,只有当开源模型追上这些尖端能力,安全才会实现平民化,而不会成为少数公司和政府手中的垄断工具。 加密货币 2026:欢迎来到“善地” 从总统发币到内幕交易的赌场 这篇文章对 2026 年加密货币行业的描述像是黑色幽默。美国总统亲自发行 Meme 币,白宫按持仓量排座次请大户吃饭;一家被联邦批准的交易所允许押注美军是否会刺杀外国领导人,且最大的一笔交易来自知晓计划的情报人员。文章借此指出,比特币和 Meme 币是自我指涉的零和游戏,价格不反映任何外部价值,只反映持有者找到下一个接盘者的信心。 预测市场成为内幕交易的合法外衣 基于 Polymarket 等平台的内幕交易已多次发生。有军人利用美军行动计划信息获利超过 40 万美元,还有匿名钱包在美军打击伊朗核设施前精准押中每一步细节,盈利近 250 万美元。平台从每一笔反向交易中抽水,监管机构 CFTC 却拥有合法权力却选择不作为。 稳定币与政治经济的闭环 通过 GENIUS 法案,私人稳定币被正式纳入美国货币体系。文章指出,物理美元通过地下市场和哈瓦拉汇款系统在发展中国家早已流通数十年,稳定币只是插入了一个不透明的中间人,把付费通道宣传成创新。上层则是规模惊人的游说机器:Fairshake 超级政治行动委员会筹集超 2.6 亿美元以打击批评加密货币的议员。特朗普家族的加密资产峰值超过 110 亿美元,形成了一个从散户身上抽水、部分转化为政策保护资金的闭环。 有真实需求,但规模被污染了 社区讨论里,有读者认同大部分批评,但坚持为稳定币辩护,认为它确实为缺乏美元账户的发展中国家工人提供了储蓄和跨境收款的手段。自己的朋友靠加密货币远程工作,避免了高额转账费,这是少有的正当用途。也有人觉得文章把买币等同于赌博过于激进,自己就是从加密货币开始,后来转向了正经的股票和 ETF。 YOLO26:去掉推理瓶颈的新版检测模型 去掉 NMS 和 DFL 模块带来的提速 Roboflow 发布了 YOLO26 系列,支持目标检测、实例分割和姿态估计等任务。它去掉了非极大值抑制(NMS)和分布焦距损失(DFL)两个过去的瓶颈模块。预测直接输出降低延迟,去除 DFL 后更容易在边缘和低功耗设备上部署。在 CPU 上,YOLO26-Nano 比 YOLO11-Nano 推理速度快了 43%。 局限与争议 YOLO26 只训练在 COCO 数据集的 80 个类别上,如果目标不在这 80 类之内就无法检测。一些长期用户表示,在自己特定的足球视频分析任务上,YOLO26 并没有比 v9 或 v11 表现更好。另外,Ultralytics 采用的 AGPL 许可证让 Frigate 这样的开源网络录像机系统无法集成它。对于需要细粒度分割或开放词汇检测的场景,社区推荐改用 SAM2 或 GroundingDINO。 相关链接: * Will It Mythos? * VibeThinker: 3B param model that beats Opus 4.5 on reasoning with novel SFT+GRPO * In praise of memcached * Polymarket has flooded social media with deceptive videos by paid creators * Cyberdecks, going analog, and convivial technology * What we call "age verification" is actually mass surveillance * Plotnine * OpenAI DayBreak – GPT-5.5-Cyber * Crypto in 2026: Oh, This Is the Bad Place * An Introduction to YOLO26
Agili 的 Hacker Podcast 2026-06-22今天的 Hacker News 上,有人回头审视职业生涯,发现它可能是一桩金融欺诈的附属品;也有新的桌面打包工具、开源模型、Minecraft 大版本更新、AI 多智能体系统发布,以及几个离谱的 bug 分析。 我的上一份工作,是不是只因为欺诈才存在? 一个工程师的十年回望 软件工程师 David Newgas 曾在一家叫 GenieDB 的英国初创公司工作。公司后来被美国风险投资基金 Frost VP 收购,他作为唯一转到美国的团队成员,在硅谷过了几年典型的创业生活。但公司始终没有超过 3 个客户,最终被开源方案淘汰。 十年后,他听说基金老板 Stuart Frost 被 SEC(美国证券交易委员会)起诉欺诈。诉状里有一句话击中了他:“当 Frost 需要更多现金维持奢侈生活时,他创建新的投资组合公司,投更多基金资本进去,然后收取更多孵化费。”David 开始怀疑,自己那份带他来美国、改变一生的岗位,是否只是欺诈链条上的一环。 结构性的浪费 Hacker News 的讨论把这个故事推向了更广的层面。有人指出,一些孵化器和政府资助项目资金最终流向了 IBM 这样的大公司,因为“可信伙伴”把钱截留了;真正有能力的团队反而拿不到资助。 另一种更隐蔽的浪费来自企业内部:一家英国大银行裁员之后,被裁的人通过外包公司以更高价格回到同一个团队做同样的事。预算科目不同——“裁员”减了人头,“外包”走另一个预算池——账面上好看了,成本反而更高。这种现象在澳大利亚银行、荷兰政府、美国海军和情报机构都有记录。David 的结语保留了一种清醒:你的工作可能比你以为的更小,但你不完全是欺诈的工具。只是一种暗流,恰好改变了你的河床。 Deno Desktop 发布:把 JS/TS 项目打包成桌面应用 直接打包,自动检测框架 Deno 2.9 推出了 Deno Desktop,可以把一个 Deno 项目——从单个 TypeScript 文件到 Next.js 应用——打包成自包含的桌面二进制。默认使用系统自带的 WebView 渲染,二进制很小;也可以选择捆绑 CEF(Chromium Embedded Framework),体积更大但渲染行为跨平台一致。 它能自动检测框架:指向 Next.js、Astro、Fresh、SvelteKit 等项目,会自动运行生产服务器或带热重载的开发服务器,代码无需修改。后端和 UI 通过进程内通道通信,没有跨进程 IPC 的序列化开销。 与 Tauri 的取舍 Tauri 的二进制可以小到 5 MB,但 Linux 上的 WebKitGTK 比主流引擎慢且内存占用更大,macOS 上老系统的 WebView 可能停在十年前。Deno Desktop 默认约 40 MB,捆绑 CEF 约 150 MB。有评论认为,CEF 选项让它在可靠性上超过 Tauri,后者也在努力加入 CEF 支持。 用 iCloud 随手拍意外做成“立体抖动照片” 从相机胶卷里挖出意外 所谓 wigglegram,是用多个角度拍摄的相似帧循环播放成 GIF,产生立体深度效果。作者是个拍照不删的人,想到自己那些从稍不同角度连拍的相似照片可能适合做这个。他写了一个脚本,用感知哈希(TinEye 用的那种反向图片搜索技术)在自己的 iCloud 图库里找出相似的照片序列,设了个阈值(汉明距离 10),一下吐出了几百张 wigglegram。 因为是真正的“意外”,很多照片更像小电影片段,而不是严格的立体图。动物、设计作品、雕塑效果最好。评论区有人建议用帧插值和锯齿循环(1-2-3-4-3-2)来平滑效果。iPhone 的 Live Photos 也能做类似的事情。 GLM 5.2 对比 Opus:一次游戏制作的气氛测试 用单次提示构建 3D 游戏 Z.ai 发布的 GLM 5.2 是 MIT 协议的开源模型,文本-only。作者让两个模型在 raw WebGL 下构建一个 3D 平台游戏。Opus 花了 33 分钟、约 22 美元,做出来的游戏角色有纹理、尖刺能杀人、有胜利条件。GLM 5.2 花了 1 小时 10 分钟、5.39 美元,但角色面朝后、纹理缺失、尖刺无效。 关键差距是 Opus 能看图——它生成画面后自己检查,修正了调试信息残留;GLM 5.2 只能读像素颜色值,根本看不出问题。但 GLM 5.2 的成本只有 Opus 的五分之一,很多评论认为对大量任务已经“足够好”,且开源模型没有供应商锁定的顾虑。 切换到开放模型,代价真有那么大吗? 从闭源到开放的权衡 作者一直把开放 LLM 当业余爱好,直到 Anthropic 开始要求身份验证,他才认真考虑切换。开放模型在排行榜上落后闭源模型几个月,生产力和隐私保护需要自己处理——要么通过不透明的第三方 API,要么自建服务。 评论区里的欧洲用户推荐了 eurouter.ai 这类路由服务,可以指定数据只留在欧盟境内、不收集、零保留。虽然背后实际提供 GPU 的可能还是美国公司,但至少法律层面有保障。有人认为 Anthropic 的“不协助政府违宪”声明只保护美国人,非美国人不在保护范围内;其新模型即便选择零数据保留,也会保留提示词和输出 30 天做安全审查。开放模型的价值正是这种灵活性——你可以自托管,也可以选信任的提供商。 OpenAI Codex 的日志 bug:21 天写了 37 TB 写入放大 1 万倍 Codex 的 SQLite 反馈日志在 21 天内写入 37 TB,年化约 640 TB。一块 1 TB 的消费级 SSD 通常只有 600 TBW 的写入寿命。问题出在全局日志级别设成了 TRACE,记录了所有底层 WebSocket 负载、遥测事件,而这些内容对调试几乎没有价值。 数据库保留约 50 万行,但 AUTOINCREMENT 计数器超过了 55 亿——历史写入是保留的 1 万倍以上。15 秒采样显示插入 3.6 万行后立即被修剪,形成持续的写入放大。两个补丁已合并,将默认过滤级别提到 INFO+,可减少约 85% 的写入。 社区反应激烈。有用户在 macOS 上只是打开 Codex 窗口等模型响应,GPU 就占满 100%,风扇狂转;另一个用户称它吃掉 70 GB 内存。有人把 Codex 和 Claude Code 一起称为“slopware”,指出这些公司自己的软件开发质量与它们宣传的“AI 革命”存在尖锐对比。 Minecraft Java 版 26.2:首个内置 Vulkan 渲染的正式版本 Vulkan 渲染与硫磺洞穴 这个代号“Chaos Cubed”的版本首次内置了 Vulkan 1.2 渲染后端,目前标记为实验性。GPU 不支持时自动回退 OpenGL。新生物群系“硫磺洞穴”有硫磺泉,上方放水会喷出水柱;新生物“硫磺立方怪”能吃掉方块并变成不同原型——吃 TNT 变炸弹,吃木材变弹球,吃冰面会滑行。 社区对 Vulkan 反应积极:OpenGL 已无法良好映射现代硬件,Vulkan 是之前预告的光照改进的前置条件。Java 版需要跨平台,所以选择 Vulkan 而非 Direct3D。但同时也有社区对近期聊天举报系统被滥用的讨论,部分玩家建议安装阻断举报数据的 Mod。 用 6 亿参数的本地模型做问题分类 从 10% 到 92% 作者 Torgeir Helgevold 为家庭问答机器人微调了一个 Qwen 3:0.6B,用来把问题归到预定义类别以缩小检索范围。基准测试准确率只有 10%,模型喜欢用太宽泛的标签,还会自己发明新类别。 第一轮微调用 Unsloth 加 QLoRA,850 条数据,准确率提到 79%,但仍会输出类别片段(如 “ac” 代替 “hvac”)。第二轮做了一个简单改动:把类别名换成两个大写字母的无语义代码,迫使模型输出固定格式。准确率跳到 92%。评论区不少声音建议直接用 Scikit Learn 的 SGDClassifier 加 2-grams,训练不到一分钟,模型小于 1 MB。 内存安全的内联汇编 Fil-C 的做法 GCC 和 clang 的内联汇编被认为不安全——约束写错会生成错误代码。Fil-C(一个内存安全的 C 变体)实现了静态验证:只允许没有内存访问、没有控制流、副作用完全被约束覆盖的指令。不安全的汇编不报编译错误,而是在运行时触发 panic——因为很多内联汇编在死代码中,不应阻塞移植。 作者用 AI 代理(先 Kimi K2.7-code,后 GLM 5.2)自动化了 x86_64 指令的白名单构建,每天检查两次,最终覆盖了数百条安全指令。评论对 AI 辅助这种复杂编译器工作的效果表示兴趣。 Sakana 发布 Fugu:协调多模型的多智能体系统 让模型自己学会分工 Sakana 的 Fugu 通过进化和强化学习训练一个轻量协调器,动态分配一组前沿模型(GPT 5.5、Opus 4.8、Gemini 3.1 Pro 等)的角色。分两档:Fugu 平衡性能和延迟,Fugu Ultra 追求最高质量。基准测试在编码、推理、科学等任务上达到或接近公开可用的最强模型。 早期用户反馈分化明显。有人说代码审查找出 20 多个问题,远超其他工具;也有人指出 $20/月的订阅配额只够用几小时/周,$200/月的高级版也不宽裕,推理速度慢,代码实现错误率还不低。有评论把它比作 OpenRouter 的 Fusion,但 Fugu 的协调器更动态,会生成多步工作计划而非简单合并结果。Sakana 与日本防卫省的合作也让部分用户顾虑。 相关链接: * Did my old job only exist because of fraud? * Deno Desktop * Help I accidentally a wigglegram * GLM 5.2 vs. Opus * There is minimal downside to switching to open models * Codex logging bug may write TBs to local SSDs * Minecraft: Java Edition 26.2, the first version with Vulkan 1.2 * Good results fine tuning a local LLM like Qwen 3:0.6B to categorize questions * Memory Safe Inline Assembly * Sakana Fugu
Agili 的 Hacker Podcast 2026-06-21Agili 的 Hacker Podcast 今日话题横跨公共设施革新、底层优化、隐私工具到神经科学:芬兰图书馆借缝纫机,Linux 异步 I/O 该选 epoll 还是 io_uring,以及为什么大脑天生就会回避坏消息。 芬兰图书馆重新定义公共价值 缝纫机、皮划艇和 Vitamix:一张借书卡借万物 芬兰 700 多座图书馆不靠借阅量衡量价值,而是提供几乎任何生活所需的物品。赫尔辛基的 Oodi 图书馆每日清晨八点开门,人们涌向座位、录音舱、缝纫机或网球拍。可以租借的除了书籍,还包括 3D 打印机、激光切割机,甚至皮划艇。BBC 报道,这些物件的借用次数仅次于图书。华盛顿县图书馆的“图书馆之物”项目也类似,从厨房搅拌机到合成器、鼓机都有。 民主基础设施和数字包容的据点 图书馆还是市民身份办理中心。馆员会帮助居民操作税务、银行、养老金和电子病历系统,并辅导求职申请。研究称图书馆是关键的数字包容基础设施。《芬兰图书馆法》明确要求图书馆促进民主与言论自由。德克萨斯大学学者 R David Lankes 指出,图书馆是少数可以不消费而单纯停留的公共空间。议会成员 Nasima Razmyar 幼年以难民身份拿到第一张图书馆卡,称其为“整个芬兰福利制度浓缩在一栋楼里”。 缝纫机的挑战与编程的相似性 一位 Hacker News 用户指出,缝纫机是仅次于汽车和笔记本的复杂高技能设备,押金和维护成本不低,对新手很困难。但另一位用户回应,老款 Bernina 几十年几乎不用维修,且编程与缝纫有相通之处:喜欢造东西的人通常会同时喜欢两者。所有讨论最终指向同一点——这种借用制度能在芬兰通行,根基是社会的高信任度。 Epoll vs. io_uring 在 Linux 中的异步 I/O 抉择 系统调用开销的源头 epoll 需要两组系统调用:epoll_wait 拿到就绪通知,再手动 read/write,此外还有事件注册的 epoll_ctl。io_uring 则通过内核与用户共享的两个环形队列直接提交与回收完成事件,一次 io_uring_enter 可以批量提交并回收一堆结果。启用 SQPOLL 时内核会生成一个内核线程持续轮询,在稳态下几乎无需系统调用,只是空转时仍会消耗 CPU,可通过 sq_thread_idle 超时休眠。 代码示例与性能表现 作者用 stdin 监控对比:epoll 需 epoll_ctl 注册、epoll_wait 等待、read 读取;io_uring 只需 io_uring_prep_read、io_uring_submit、io_uring_wait_cqe。实测 io_uring 网络服务吞吐量比 epoll 版本高约 20%。但一位切换到 io_uring 的开发者反馈 CPU 占用飙升,这可能是因为减少了 I/O 等待,CPU 有更多时间做实际工作,应看延迟和吞吐而非利用率。 优化方向与安全争议 社区热论集中在 CPU 绑定和虚假共享。通过 SO_INCOMING_CPU 将监听 socket 与线程绑定同一核心,配合网卡 toeplitz 哈希,可避免跨核通信,有的场景下性能可以提升 10 倍。虚假共享方面,不同核心的线程应避免写入同一个 cache line。安全性上,由于用户态与内核直接共享内存,io_uring 多次曝出漏洞,许多容器仍默认禁用。最新内核支持用 cBPF 限制允许的操作,但 Red Hat 需要 6-12 个月才能整合到长期支持内核,短期内大多数沙箱仍会屏蔽 io_uring。因此,若目标环境受限,epoll 依然是稳妥选择。 Loupe:窥见你的 iPhone 对其它 App 暴露了什么 无需弹窗的设备指纹 Loupe 是 Mysk 安全团队开发的开源 iOS 应用,无网络权限,也不会离开设备。它展示任何第三方 App 无需额外授权即可读取的信息:时区、语言、屏幕尺寸、电池状态、键盘语言,还有 iPhone 首次初始化或上次抹掉的精确时间。这个时间戳来自文件系统卷创建时间,结合其它信息可以生成独有设备指纹。 绕过权限的旁路:50 个 URL scheme App 可以通过 canOpenURL 探测设备上安装了哪些第三方应用,苹果限制最多声明 50 个已知 URL scheme。但这对区分用户已经足够,且头部 App 每周更新探测列表。即使清理了 App,Keychain 中的数据在删除后依然保留,可作为持久化标识。Loupe 展示了过去安装过的 App 如何识别你。 社区追问:为什么不能直接关闭 App 联网 多位用户疑惑 iOS 为何没有网络权限开关。事实上,中国区 iPhone 提供“仅 WLAN”或“关闭网络”选项,而 GrapheneOS 允许安装时限制任意 App 的联网。但单一网络开关难以消除风险,因为多数 App 有正当联网需求,用户可能被迫同意;且 App 间可通过进程通信间接联网。苹果内置的 App 隐私报告能记录域名访问,但无法看到传输内容。Mysk 团队也提供了一款反指纹浏览器 Psylo,作为替代方案。 慢速呼吸如何调节大脑和冒险行为 呼吸频率与决策的神经关联 《Neuron》期刊发表的研究发现,刻意减慢呼吸能改变大脑特定区域活动,降低冒险倾向。实验表明,慢速呼吸不仅调节情绪,还通过神经机制直接影响决策。研究者认为,这一发现为焦虑和冲动控制等临床干预提供了依据。 家中 15 分钟检测莱姆病的试纸 40 美元的研磨式检测盒 LymeAlert 预计今年 8 月上市,把找到的蜱虫放进附带塑料盒旋碎,插入化学试纸,15 分钟变色便知是否携带莱姆病菌。一次可检测最多 5 只蜱虫。传统实验室检测需等待一周以上,花费 50 到 450 美元。 应用场景与局限 阳性结果促使及时就医,抗生素需在叮咬后 72 小时内服用才有效。阴性结果可避免不必要的急诊和抗生素。但测试无法检出其他病原体,比如可即刻传播的 α-半乳糖综合征过敏原或波瓦桑病毒。感染病专家提醒,假阳性可能引发恐慌,且蜱虫传播速度因病菌而异。 数据汇总预测扩散 配套 App 允许匿名上报发现感染蜱虫的位置。创始人计划将数据与 NASA 卫星图、动物迁徙数据结合,用 AI 模型预测不同蜱种和病原体的扩散方向。 TownSquare:一个 <script> 标签为网站添加实时访客广场 无需注册的实时碰面 网站主插入 TownSquare 脚本后,访客能用方向键移动一个小角色,在页面底部聊天、击掌。项目已注册 115 个广场,47 个活跃,累计消息 23 万条。不保存历史,没有算法。作者坦承代码大部分是“vibe-coded”(大模型生成)。 低俗内容与意外乐趣并存 演示页面里的实时对话很快出现大量粗鲁内容。一位用户评价“我不会放在自己网站上”,另一位反问“如果你的网站吸引了这些内容,或许说明问题在别处”。同样有人感受到了久违的即时社交乐趣,建议加入绿点在线人数和可折叠的聊天框。 技术讨论 有人提议使用 WebRTC 可减少服务器负担。Hacker News 流量冲击下,广场里即刻涌现打招呼、玩梗的访客,也有人公开怀疑“它撑不了多久”。 开发者为什么总误解 CORS Zoom 的图片尺寸 hack 2019 年 Zoom 在用户电脑启动本地 Web 服务器,为了让网页端指令打开桌面 App,没有用 AJAX,而是把状态编码到返回图片的尺寸中,前端再用 case-switch 识别。作者 Chris Foster 认为 Zoom 团队不理解 CORS,实际上只需在本地 API 加上 Access-Control-Allow-Origin: https://zoom.us 头。 CORS 的真正边界 评论区立刻纠正了作者的错误:CORS 头仅控制读取响应,无法阻止其他网站发送请求。对于“简单请求”(如 GET、简单表单 POST),浏览器不发送预检,直接发出请求,若服务端在 GET 上执行有副作用的操作,就可能被任意网站利用。Zoom 的漏洞恰恰在于把危险操作放在了 GET 上。 隐藏的 Content-Type 陷阱 另一个风险是即使请求体是 JSON,但 Content-Type 若设为 text/plain 或 multipart/form-data,浏览器也不会触发预检。因此后端必须严格校验 Content-Type,而不仅仅是依赖 CORS。多数开发者因“先有同源策略,后有 CORS”的历史盲区,将 CORS 视作拦截器,进而试图绕过它,反而扩大了攻击面。 Google 用户中 IPv6 比例首次突破 50% 测量数据与统计差异 Google 测得其用户中 IPv6 的占比达 50%,APNIC 加权后为 42%。差异来自统计方法:APNIC 按经济体的互联网人口加权,以消除广告投放带来的样本分布不均。两套数据共同框定了 IPv6 的当前实际渗透范围。 手机运营商突进,企业网络脱节 印度 Reliance Jio 等移动运营商大量部署 IPv6,周末流量中手机端拉高了 IPv6 比例,工作日企业 IPv4 流量又把曲线拉低。许多公司因管理复杂度仍关闭客户端 IPv6,部分大型服务如 GitHub 至今没有 AAAA 记录,IPv6 用户只能通过 NAT64 中转才能访问。 双协议世界的日常摩擦 即使 IPv6 已覆盖主流内容商,长尾小众网站仍坚持 IPv4,导致用户偶尔遭遇部分服务 IPv6 端点故障而 IPv4 正常的情况。同时,多数 IT 培训和测速工具仍忽视 IPv6。尽管如此,4G/5G 手机默认走 IPv6,苹果、Windows、Android 已启用隐私扩展随机化地址。Google 的 50% 里程碑说明 IPv6 已不是边缘实验,而是每日运行的基础设施。 用 AVX-512 加速锯齿编码解码的尝试 掩码条件运算:省一条指令,增一点延迟 锯齿编码将有符号整数转为无符号,标准解码需 4 条 SSE2 指令。利用 AVX-512 的 vptestmd 生成掩码并条件异或,可压缩到 3 条,但 Zen 4 上 vptestmd 延迟 3 周期,总延迟反增到 4 周期。在吞吐量受限的 meshlet 解码循环中仍有约 3% 的收益,但会受 Clang 编译器的“反向优化”干扰。 GFNI 指令的单步 8 位解码 GFNI 的 vgf2p8affineqb 能通过一个 8x8 位矩阵乘法,单指令完成移位和取反,用于 8 位锯齿码解码。该指令在 Zen 4 延迟 3 周期、吞吐量 2/cycle,理论比原方案快 1 倍,但在实际顶点增量解码循环中,瓶颈在增量累加与短存储,性能提升不明显。 编译器无法自动应用的局限 评论指出,编译器难以自动向量化此类优化,因为它不能改变内存布局,大多数自动向量化会插入大量洗牌指令抵消收益。此外,meshoptimizer 已是游戏行业资产管线的“隐藏冠军”库,这类深度优化需要手工编码,AVX-512 普及率有限也使编译器不愿投入。 大脑没进化到能消化这么多坏消息 负面新闻的生理吸引力 Reuters Institute 2025 年报告显示,全球 40% 的人主动回避新闻,加拿大达 69%。《自然·人类行为》上分析近 600 万次点击的研究发现,新闻标题每增加一个负面词,点击率就上升,正面词效果相反。身体在意识判断威胁是否相关之前就已启动应激反应。 何为问题性新闻消费 研究者将“导致思维占据、失调和日常功能紊乱”的新闻接触定义为问题性新闻消费(PNC)。2022 年调查中,17% 的美国人达到严重 PNC 水平,其中 61% 的人经常感觉不舒服。少数族裔群体反复目睹针对自己群体的伤害会带来额外心理冲击,即使自己不是直接目标。 管理而非戒断 解决之道不是切断可靠信源,因为在虚假信息泛滥下这只会更糟。研究者建议把新闻限制在固定时间段,选择深度长文而非碎片化的情绪帖子,并在知晓和行动之间搭建桥梁——哪怕一件小事都能调节压力。特别警惕愤怒诱饵:那些故意激怒你以博取互动的内容。一位 Hacker News 读者补充,很多人对世界的期望不切实际,面对现实时便感到压力,而社交媒体常要求成员通过“表演式关注”维持归属,即使他们对遥远事件毫无影响力。 相关链接: * Renting a sewing machine from the library * Epoll vs. io_uring in Linux * Loupe – A iOS app that raises awareness about what native apps can see * Slow breathing modulates brain function and risk behavior * 15-minute at-home Lyme disease tick test * Show HN: TownSquare, a tiny presence layer for websites * Developers don't understand CORS (2019) * Google Hits 50% IPv6 * Zigzag Decoding with AVX-512 * The brain was not designed for this much bad news
Agili 的 Hacker Podcast 2026-06-20Agili 的 Hacker Podcast 今日话题跨了数据压缩、排队论、城市绿化、神经科学、AI 模型比较,甚至还有把网站塞进 Favicon 的巧思和 3800 年前的分数表。这些讨论在 Hacker News 上争得细致,我们把关键信息和观点整理了出来。 数据压缩原理 所有压缩都是建模加编码 Matt Mahoney 在 2012 年发布的《Data Compression Explained》把数据压缩分解为两部分:模型估计每个符号的概率,编码器为高频符号分配较短码字。编码问题已有算术编码等最优解,但建模在一般意义下不可计算——最优建模等价于 Kolmogorov 复杂度,而 Kolmogorov 复杂度无法通过算法得出。所以压缩本质上是一个理解数据、预测数据的 AI 问题。 为什么通用最优压缩器不存在 Mahoney 用大量基准测试(Calgary Corpus、Hutter Prize 等)说明,LZ77、PPM、BWT、上下文混合等算法在压缩率、速度和内存上分布出一条帕累托边界,“没有万能压缩器”。压缩随机数据或者递归压缩本身就是死胡同。社区评论补充说,如今 Fabrice Bellard 等人用神经网络建模已经在压缩率上超过了传统榜单,但神经网络模型体积大、解压内存高,长期归档还缺纠错码。 LLM 与压缩的边界 有评论把大语言模型看成一个有损压缩模型:训练目标正是逼近数据的最短描述,配合算术编码甚至可以做无损文本压缩。但 tokenizer 只面向语言,换成字节级模型(如 ByT5、BLT)理论上能处理任意数据,实用化却被模型体积和版本兼容困住。这条路还远。 屏幕之外的色彩世界 青色为何是屏幕的盲区 人眼三种视锥细胞靠对比强度还原色彩,屏幕用红绿蓝控制这三种细胞,理论上覆盖大部分颜色,唯独青色大量落在 sRGB 三角形之外。LED 照明也恰好遗失这个区间:白光 LED 用蓝芯片加黄色荧光粉,青色掉进了光谱的深谷。 在真实世界捡回那些青与蓝 透过叶子看太阳,蓝光被吸收、红光部分被吸收,剩下纯粹的绿;水下光线多次过滤后的青蓝色,能把《蓝色星球》的画面衬得黯淡。孔雀眼斑周围的青色来自羽小枝的薄膜干涉,磨成粉末就成了深棕色;约 500 种鸟的颜色超出 sRGB。 最纯的颜色或许来自激光 城市绿灯其实是极其饱和的青绿色——NIST 标准有意选了这个色调让色盲也能区分红绿。激光接近单色,绿色激光因此成了科幻电影里代表“高级技术”的符号。作者说,520 纳米附近的颜色因为几何原因最难自然产生,所以绿色激光像是“最人工的颜色”。 负载均衡系统的惊人经济学 更多服务器居然降低延迟 一个看似反直觉的排队论结果:在同样的 80% 利用率下,服务器数量越多,请求排队概率越低,平均延迟迅速下降并趋近纯处理时间。5 台服务器时只有 3.6% 的请求需要排队,10 台时进一步降低。这对云服务账本是个好消息。 现实远比公式复杂 这个结论依赖 Poisson 到达和指数服务时间。真实流量往往有惊群效应和重尾分布,服务时间更接近对数正态分布,尾部延迟会被拉长。负载均衡器很多是随机分配的无状态模式,并不天然形成中央队列,需要额外参数来近似上述模型。此外请求如果不独立(比如多智能体 LLM 系统),合并的好处会被协调成本反转。 3-30-300:城市的绿色公平 从窗户能看见三棵树吗 “3-30-300”规则由 Cecil Konijnendijk 提出:每户要能看到至少三棵树,社区树冠覆盖率达到 30%,且距离公园不超过 300 米。一项涵盖 862 个欧洲城市的研究显示,只有约一半居民从窗户能看到三棵树,南欧城市尤其惨淡。 30% 树冠覆盖是最大挑战 达标区域集中在德国西部小城,整个欧洲只有约三分之一的人生活在这种环境中。全球八大城市中仅新加坡全部通过,热带气候和集中规划是主要原因。多名评论者提到,不同树种、树龄和位置带来的影响差别巨大,“30%”这个数字太粗了。 300 米公园与行动 300 米内公园的指标最容易实现,但超过这个距离公园使用率急剧下降。综合三项全部达标的欧洲人只有 14%。研究者给出的行动指南很直接:刨掉沥青,种树。 把网站存进 Favicon 像素就是字节 作者没有用隐写术藏数据,而是直接把 HTML 编码成 favicon 的 RGB 像素。每像素三字节,前面加 4 字节长度头,生成的 9×9 像素图标看起来像随机噪点。浏览器加载图标后,Canvas API 读出像素,解码成 UTF-8 文本,一个网站就这么“存在”了 favicon 里。 启动代码不可省略 favicon 只承载内容,解码需要的几行 JavaScript 仍然得单独提供。没有这段 bootstrap,它就是一张 PNG。功能上不实用,但作者在意的是测试“图标是一堆字节”这个边界。 更聪明的替代方案 评论里有人提出直接用 SVG favicon,标记本身就是文本,fetch 回来即可;还有人提到 PNG 的 tEXt 块可以塞任意数据,但那就没那么好玩了。一个极端的思路是让 index.html 和 favicon.png 指向同一个文件,省去一切额外步骤。 神经元局部蛋白质合成与记忆 推翻了四十年前的共识 神经科学家 Oswald Steward 在 1982 年发现神经元突触周围存在核糖体,说明蛋白质可以在突触本地合成,而不是只能从细胞体运输。当时没人相信,15 年后才被认真对待,直到 2026 年获得 Kavli 神经科学奖,这个时间跨度本身就说明基础学科验证之难。 局部合成如何支撑记忆 记忆依赖特定突触的强度变化,这需要新蛋白质。如果把数千个突触的蛋白都由细胞体统一运输,交通会崩溃。RNA 被提前送到每个突触附近,哪里需要就在哪里开工,这是突触可塑性的核心机制。脆性 X 综合征和阿尔茨海默病的早期表现也都和突触蛋白合成异常有关。 记忆只住在大脑里吗 有评论提到扁形虫被砍头后,新长出头部仍保留旧记忆;器官移植受者偶尔出现新偏好,虽然原因可能是药物或心理,但记忆未必是大脑的单极叙事。Steward 则把对话拉回原点:他相信理解大脑能给 AI 带来更多东西,而不是反过来。 规模越大幻觉越重?AI 模型的比较 开放模型正在拉平差距 GLM-5.2(753B 参数,MIT 许可)在 Artificial Analysis Intelligence Index 上仅比 GPT-5.5 低 4 分,而后者参数量保守估计在 1–2T。纯靠放大规模的智能收益已经明显趋平。 “不知道”也是一种能力 在 AA-Omniscience 基准上,DeepSeek V4 Pro(1.6T 参数)面对无解问题只有 6% 的概率承认不知道,幻觉率高达 94%。GLM-5.2 幻觉率 28%,GPT-5.5 则达 86%。用同一个编程陷阱测试,DeepSeek 花了近 4 分钟和 7.7k token 给出了结构完美的错误答案,GLM-5.2 只用 12 秒就指出了问题本身不成立。学会及时说“做不到”成了区分实用性的关键。 训练数据正在从公开转向定制 评论中有人透露,自己兼职为 AI 公司编写从不存在过的软件,专门针对模型弱项生成训练数据。Mercor 等服务商每天向签约专家支付 300 万美元,用评判标准驱动强化学习。规模竞赛已经从爬取网络文本变成了重金定制高质量数据。 以儿童之名:强制实名上网的滑坡 RTA 头部就能解决,但没人提 文章指出,要过滤成人内容,网站只需在响应中加入一个 RTA 头部,浏览器端即可根据家长控制决定是否展示。这个标准已经有十多年,成本近乎零。但政客绕过它,直奔集中化身份验证数据库——既能养活商业验证商,又能铺开全面追踪的框架。 实名制的扩展路径 立法者先以儿童保护为名强制成人网站年龄验证,再扩展到社交媒体,最后到达银行、聊天工具和游戏。一套统一身份系统建成后,任何“出格”言论都可能面临罚款或人肉搜索。文章也提到 Web Environment Integrity 和 Secure Boot 等技术有可能被用来限制只允许签名网站访问,连 Tor 也难逃。 评论的棱角 社区提供了几种不同思路:让使用第三方身份验证的公司对数据泄露承担毁灭性责任(每泄露一条罚 100 万美元);干脆把给未成年人联网设备定义为违法,将责任锁定在父母层面;也有人批评原文将互联网比作上膛的枪过于夸张。 CSS 版 Quake:用样式表跑游戏 CSSQuake 把 Quake 的 3D 渲染交给了 CSS 的 transform 属性,游戏逻辑仍由 TypeScript 完成。在 M1 Pro 的 Safari 上不太流畅,换成 Chrome 或 Firefox 就好很多,有用户跑到了 60 FPS。作者坦言没有做性能优化,因为 CSS 本来就不是游戏引擎。部分机制和原版有出入,比如电梯按钮要靠射击触发,敌人击毙后会飘在空中。项目用了 id Software 的共享版资源,和 cssDOOM 一样在探索 web 标准的极限。 3800 年前的分数表 只能用单位分数的阿姆斯纸草书 古埃及人表示分数时只能用单位分数(分子为 1 的分数)之和,且同一个单位分数不能用两次。例如 3/5 写成 1/2 + 1/10,而不是一个简单的 3/5。存世最古老的数学文献之一阿姆斯纸草书,主体就是 2/n 的表格。 为什么只有 2/n 表 作者 Mark Dominus 给出的解释是:有了这份表,任何分数都能通过二进制拆分和查表得出。把分子拆成 2 的幂次和,查表翻倍,合并重复项,再用 2/n 表消去重复,整套步骤完全是机械操作。19/20 最终可以化简为 [2,4,5]。所以阿姆斯不需要 3/n 或 4/n 的表,一张 2/n 表就足够。这种思路也和埃及人习惯的二进制乘法一致。 相关链接: * Data Compression Explained (2012) * Where to Find the Colors Your Screen Can't Show You * Surprising economics of load-balanced systems * Can you see three trees? * I Stored a Website in a Favicon * The discovery that changed how scientists think about memory * GPT-5.5 hallucinates 3x more than MIT-licensed GLM-5.2 * Think of the children: How to force real ID for all internet traffic (2023) * CSSQuake * Egyptian Fractions (2006)
Agili 的 Hacker Podcast 2026-06-19欢迎来到 Agili 的 Hacker Podcast 今日看点。今天我们会聊 MIT 为研究芯片安全从零写操作系统、Java 酝酿十二年的 Valhalla 终于合入主分支,还会看到 DuckDB 如何把整个分析型数据库塞进一个 20MB 的单文件里。 MIT 为研究芯片安全从零写了一个操作系统 为什么要重写一个内核 安全研究人员想在 Apple M1 这类芯片上验证 Spectre、Meltdown 攻击的细节,但过去只能在 macOS 或 Linux 上手动改内核,不稳定且难以复现。MIT CSAIL 团队索性从裸机写起,打造了专用于微架构研究的操作系统内核 Fractal。 “外核线程”让实验信号几乎没有噪声 Fractal 的核心设计是“多特权并发”,能让同一个实验在运行时切换特权级别,同时保持指令和地址空间不变。关键构造“外核线程”处在用户进程的内存里,却以内核特权执行,这让测量结果几乎不含中断、调度带来的背景噪声。 M1 上发现了什么 团队用 Fractal 在 M1 上发现了多个此前未知的行为。比如 ARM 的 CSV2 规范本应阻止低特权代码影响内核的推测执行,但 Fractal 发现 CPU 在保护机制起作用之前就已经把目标地址取进了指令缓存,这个操作仍然可以通过侧信道被观测到。团队还首次在 Apple Silicon 上验证了一种叫 Phantom 的推测攻击,并澄清了过去关于条件分支预测器跨特权级训练的误解——之前认为仅在性能核上有效,实际上是实验期间 macOS 悄悄把线程迁移到了不同核心。 只用了 31000 行代码 Fractal 支持 x86_64、ARM64 和 RISC-V,代码量约 31000 行,配了 POSIX 系统调用、C 标准库,甚至能在上面跑 vim 和 GCC。项目已在 GitHub 开源,论文和全部实验数据也一并公开。有社区成员说,这个思路在 Spectre 保密期里微软工程师就玩过,但把它做成可复用的研究基础设施,Fractal 做到了。 DuckDB 内部机制详解(第 1 部分) 一个进程内分析型数据库 DuckDB 是一个进程内分析型 SQL 数据库:不需要服务器,像加载 NumPy 一样直接链接到程序里,单二进制文件不到 20 MB。它专为扫描数百万行做过滤、聚合、连接之类的查询优化,而不是按主键单点查找。你可以直接对某个装满 Parquet、CSV 文件的目录写 SQL。 消除网络序列化的开销 传统分析型数据库通过网络收发数据,每条结果记录都要序列化成协议格式再反序列化,这往往是查询中最慢的环节。DuckDB 在同一个进程里运行,能直接读取 Python dataframe 的缓冲区,甚至实现零拷贝。配合 Arrow 这样的列式内存格式,它绕开了逐行逐值函数调用的巨额开销。 从 SQL 到物理管线 SQL 进入 DuckDB 后经过解析、绑定、优化等阶段,优化器包含 33 个可单独禁用的转换规则,比如 filter pushdown、子查询展开和动态连接过滤器。物理计划最终被分解成一个个管线,没有需要看到全部数据才能产生结果的算子(如排序或分组)会形成断点,断点前三阶段(sink、combine、finalize)并行完成,充分利用多核。 列存与文件直查 数据库内部按列分开存储,每列分成约 12 万行的行组,每个行组携带最小最大值和空值计数这样的 zone map,查询时能直接跳过不相关的组。很多使用者并不建表,而是直接查询 Parquet 文件——Parquet 本身也是列存、带统计信息,DuckDB 连远程文件都只需要按需抓取部分字节。 Project Valhalla 历时十年终于抵达 JDK 28 “写起来像类,跑起来像 int” Project Valhalla 的口号是让 Java 里自定义的类型在内存中变得扁平、密集,像基本类型一样,避免每个对象都带对象头、堆分配和指针跳转。6 月 15 日 Oracle 工程师确认 JEP 401(Value Classes and Objects)已合入 OpenJDK 主线,变更超过 19.7 万行代码,准备在 JDK 28 中预览。 值类和值对象能带来什么 在 JDK 28 里,用 value 声明值类,所有字段隐式 final,== 比较的是字段的逐位等效性,不再靠对象身份。配合 JEP 402,Integer 这类包装类也变成值类,== 终于比较的是数值。JVM 通过标量化和堆扁平化来优化:在栈上把值对象拆成字段,在数组里将字段直接连续存放,避免指针跳转。不过限于当前 64 位原子写,部分超过 64 位的对象还无法扁平化。 未完成的部分和社区争议 nullability 被推迟到独立 JEP,特化泛型也仍在研发中。许多评论者拿 C# 在 2002 年就实现了非空值类型来对比,但也有人指出 Java 有 30 年的向后兼容负担,分阶段发布更务实。团队核心成员解释,值类的设计目标是统一 Integer 和 int,放弃双投影模型是因为 80–90% 的开发者偏好简单方案。 日本铁路拆分后如何用同一个标志保持一体感 124 天从零建立新品牌 1987 年日本国有铁道因巨額负债被拆分成 7 家 JR 公司,日本设计中心的山本洋司只有 124 天时间设计统一的标志、字体和全部应用物料。最终的 JR 连体字形意在表现“铁轨贯穿全国”,线条够粗,列车行驶时也看得清。 颜色来自工艺限制,字形改了一个不吉利的汉字 当时只有 15 色热转印色卡可用,设计师把这 15 种颜色摊在总裁面前,各公司各取所需,事后才用地域象征合理化各自的颜色。更极致的是,“鉄”字左边是“金”右边是“失”,在赤字中诞生的公司用这个字太不吉利。山本将“失”换成形近的“矢”(箭头),还专门去国会图书馆确认这个字确实存在。整个字标系统在印刷截止前一天傍晚才获批,但他觉得不够完美,又通宵重绘了所有公司的字标才赶上交付。 一夜贴标一万辆车 最初只打算给少量列车换标,但设计中心提议在第一天就让全系统一万辆车贴上 JR。利用末班车与首班车间 4–5 小时的窗口,工人们一列一列手工贴标。这份“最后一次服务”的使命感让大规模改装成为可能。近四十年间这个标志从未更换,社区认为这某种程度反映了经营的稳定。 AirPods 效应:耳机在改变我们与世界的相处方式 到处都有人戴着耳机 作者从德国回到美国后,发现不管咖啡馆还是超市,几乎人人耳中挂着一副 AirPods。有调查显示 44% 的美国人使用蓝牙或无线耳机,重度使用者更容易感到孤独,也更少与陌生人进行有意义的对话。 少说话、少反思 一项 2026 年的研究发现美国人每天说出的单词数比 2005 年减少了 28%,而耳机鼓励人们避免与收银员交谈、在屏幕上点餐付款。更深层的问题是,耳机挤占了与自己独处的时间——用南加州大学教授的话说,只有脱离即时活动让思维自由游荡时,才会发生深度的反思和意义整合。 “你就吃那个?” 在杂货店,一位陌生老人对作者盘中的辣椒拌菜打趣了几句,这 15 秒的交流让作者整个下午更愉快。心理学研究指出,这些微小互动累积起来会让人相信“人们大体是善良的”。耳机有屏蔽噪音和帮助专注的好处,但作者几年前就有意识地减少使用频率。 Gribouille 0.3.0:Typst 的图形语法库更新 坐标系与图例控制更灵活 Gribouille 0.3.0 发布了,这是一个用 Typst 实现图形语法的库。新版本可以用 guides(x: none) 隐藏坐标轴刻度线和标签,无需修改主题即可做到。图例控制也支持 guides(none) 一键隐藏所有未单独设置的部分。 API 清理与面积图改进 compose() 新增 theme: 参数,统一设置合成图表的共用标题和图例样式;defer(plot, ...) 替换了之前的 plot(..., defer: true)。面积图现在默认按栈对齐和堆叠显示,不再需要显式指定统计变换和位置参数。标记函数 annotate() 还获得了 clip 参数,设为 false 后可让标注绘制到面板边界之外。社区有人关心是否能渲染成交互式 SVG,目前 Typst 可输出 SVG,但悬停数据需要额外脚本介入。 现代汽车买断 Boston Dynamics 全部股份 SoftBank 行使卖出选择权 Hyundai 以 3.25 亿美元购买了 SoftBank 持有的 Boston Dynamics 剩余 9.65% 股份,实现全资控股。这是 SoftBank 行使此前保留的卖出选择权,把 Boston Dynamics 整体估值推至约 34 亿美元。SoftBank 抽身转向 AI 基础设施,正在组建 Roze AI,并重注押在 OpenAI 上。 Atlas 将在 Hyundai 自家工厂里先干起来 Hyundai 计划 2028 年在佐治亚州的电动车工厂让 Atlas 开始做零件排序等实际工作,关键关节电机由集团内部的 Hyundai Mobis 生产。这有别于 Tesla Optimus 或 Figure AI:Hyundai 自己是工厂主,第一手客户就是自己,不需要先说服别人买机器人。社区里围绕“通用人形 vs 专用机械臂”展开了讨论,有人觉得长尾任务确实需要类人形来替代人类,也有人认为很多任务完全可以用现有固定或移动机械臂解决。 禅与机器学习研究 气质比才华更关键 作者认为成为优秀机器学习研究者的过程和冥想很像:把读书与动手构建结合起来,不论有没有灵感都持续投入时间。研究方向不要追逐热度不够半年的概念,人工智能基础思想四十年没怎么变,把交叉熵手算、奇异值分解可视化到脑子里,比琢磨今年的流行词更值。 对待结果要有“平等心” 实验结果好,很好;结果差,也很好——两者提供的信息量相同,一串负面结果往往比单个正面结果更有教益。但对那些看起来太好的结果要极度偏执,一大半好结果都是代码 bug 制造的。现代深度学习堆栈极复杂,错误可能出在训练、推理、数据、框架的任何地方,不弄清楚就无法相信任何结论。 放空和苦功夫 苯环结构来自梦,Ozempic 来自毒蜥毒液,好的想法常在散步和放空时冒出来。创意背后则是数百小时的苦工:Andrej Karpathy 手动标注了一大块 ImageNet,SWEBench 的作者花了数百小时清洗 GitHub 数据。文中用了一句禅语:“悟之前砍柴挑水,悟之后砍柴挑水。”成功的项目很少绕过笨重的细节。 Datasette 新插件让用户托管自包含 HTML 应用 在 Datasette 里直接跑小应用 Datasette Apps 是一个新插件,允许在 Datasette 实例中托管带 HTML 和 JavaScript 的自包含应用。应用跑在受限的 <iframe sandbox> 沙箱里,配合 Content-Security-Policy 头部禁止对外部域名的请求,也拿不到 cookies 或 localStorage。应用可以用 JavaScript 执行只读 SQL 查询,也可以按配置好的存储查询执行写入操作。 技术安全与 AI 辅助 作者用 <meta> 标签设置了额外 CSP,发现恶意 JavaScript 无法在页面开头之后修改它。应用与父窗口的通信使用了 MessageChannel,导航后通道自动关闭,降低劫持风险。插件还内置了日志面板,方便调试 SQL 查询和 CSP 错误。用户可以把一段描述应用限制和可用 API 的提示粘贴到 ChatGPT 或 Claude 里让模型生成代码。安全评估发现了一个严重漏洞:普通用户可能通过自设 CSP 域名窃取管理员数据,修复方案是将设置允许域名的权限独立为 apps-set-csp,仅限受信任人员使用。 ClickHouse 开源十周年 从替换 localtime 开始 2016 年 6 月 15 日 ClickHouse 开源时只是 Yandex 内部替代 MySQL 和自建 MapReduce 的列式分析引擎。创始人 Alexey Milovidov 从一开始追求最高级别开源,把仓库当作别人学习 C++ 和数据结构实验的地方。一个完整的 CI 运行需要约 400 小时,曾帮助发现 jemalloc 甚至 Linux 内核里的 bug。 用户的实际感受 很多用户用 ClickHouse 替换 Elasticsearch 和 Loki 做可观测性,即使未索引的 LIKE '%hello world%' 查询也远超 Loki 索引后的速度。有人抱怨 JSON 导入有隐蔽陷阱,比如 JSONEachRow 下数字字段默认返回字符串,开启跳过未知字段后拼写错误会静默丢弃数据。零拷贝复制等功能则被限制在商业版中。尽管如此,大多数评论仍认为 ClickHouse 是“用正确工具做正确事”的好例子。 相关链接: * To study how chips work, MIT researchers built their own operating system * DuckDB Internals Part 1 * Project Valhalla, Explained: How a Decade of Work Arrives in JDK 28 * How Japan's railways stayed one while splitting apart * The AirPods Effect * Gribouille 0.3.0: A Grammar of Graphics for Typst * Hyundai buys Boston Dynamics * Zen and the Art of Machine Learning Research * Datasette Apps: Host custom HTML applications inside Datasette * Ten years of ClickHouse in open source