

260402|领英非法搜索,瑞典弃屏用书Hacker News 今日看点:谷歌发布 Gemma 4 开放模型,量子计算新进展或将加密安全时间线提前,以及瑞典教育界对数字工具的反思。 谷歌发布 Gemma 4 开放模型 新一代开放模型 Google 发布了其最新的 Gemma 4 系列开放模型。开放模型通常允许开发者和研究人员下载、修改并部署,以促进更广泛的创新。 社区关注 此次发布后,社区讨论预计将围绕新模型的性能、架构更新、许可条款的开放程度以及与现有模型的比较展开。大家也关注其在各种实际应用场景中的潜力。 量子计算新进展威胁加密安全 两项关键突破 本周量子计算领域发布了两项重要进展。首先,加州理工学院团队展示了如何通过高码率编码实现更低开销的量子容错。其次,谷歌团队公布了一种低开销的肖尔算法实现方案,能够破解 256 位椭圆曲线密码学 (ECC)。 对密码学的冲击 这两项成果结合,可能将量子攻击的威胁时间线提前。加州理工学院团队估计,破解比特币签名所需的物理量子比特数量可能从一年前估计的数百万个降至约 25,000 个。这凸显了当前升级到抗量子密码学的紧迫性。 关于信息披露的讨论 谷歌团队选择通过加密零知识证明来宣布其成果,而非透露具体细节,以防被潜在攻击者利用。这种做法引发了讨论。有评论指出,一旦知道存在更优的方案,其他团队可能很快会独立发现它。许多网络安全专家认为,公开信息可以促使仍在使用易受攻击系统的机构采取行动,更有利于整体防御。 LinkedIn 被指控非法扫描用户电脑 核心指控 一项名为“BrowserGate”的调查指控 LinkedIn 非法扫描用户电脑。每次用户访问其网站,LinkedIn 的隐藏代码会搜索电脑上安装的软件,并将结果传输至其服务器及第三方公司,整个过程未经用户同意,也未在其隐私政策中披露。 涉嫌企业间谍活动 调查报告指出,LinkedIn 扫描了超过 200 种与其销售工具直接竞争的产品,如 Apollo、Lusha 和 ZoomInfo。通过利用用户的雇主信息,LinkedIn 能够绘制出哪些公司正在使用其竞争对手的产品,从而窃取商业秘密。 数据泄露与合规问题 扫描的浏览器扩展程序还能揭示用户的宗教信仰、政治观点等敏感个人数据,这在欧盟法律下是被禁止收集的。此外,报告还指控 LinkedIn 在遵守欧盟《数字市场法案》(DMA)方面欺骗了监管机构,其提供的 API 接口流量远低于内部使用的 API,同时却扩大了对第三方工具的监控。 什么是“订阅轰炸”以及如何防范 攻击原理与目的 “订阅轰炸”是一种网络攻击,攻击者使用机器人将受害者的邮箱地址批量注册到成百上千个网站。其目的是用海量的验证和欢迎邮件淹没受害者的收件箱,以掩盖攻击者在此期间进行的恶意操作,如重置银行密码或进行未授权购物。 隐蔽的攻击模式 Bytemash 公司发现其服务遭遇此类攻击。攻击模式非常隐蔽,没有流量高峰,每小时仅有 1-2 次注册,从而绕过了传统的“限速”防御机制。机器人的行为模式,如打字和页面导航间隔,也经过设计以模仿人类,避免被简单检测。 有效的防御措施 Bytemash 最终通过集成 Cloudflare Turnstile 解决了问题。这是一种无需用户交互的“验证码”替代方案,可在后台分析浏览器信号以识别机器人。此外,他们还修改了邮件发送逻辑,确保在用户点击验证链接前,只发送一封验证邮件,避免成为攻击的帮凶。 2026 年有效的电子邮件混淆技术 为何需要混淆 在网站上公开电子邮件地址,容易被自动化的“邮件收集器”爬取,导致垃圾邮件泛滥。电子邮件混淆技术旨在通过各种方式隐藏邮件地址,阻止机器人识别。 有效的混淆方法 测试表明,多种技术在 2026 年依然有效。 * 基于 JavaScript 的方法:通过 JS 拼接、转换或 AES 加密来动态生成邮件地址,对机器人极为有效,因为它们大多不执行 JS。使用 AES 加密需要网站启用 HTTPS。 * 基于 HTML 和 CSS 的方法:将邮件地址隐藏在不常见的 HTML object 元素或利用 display: none 的 CSS 样式中,成功率也很高。 * 简单但有效的方法:即使是简单的 HTML 实体编码,也阻挡了 95% 的邮件收集器。 关键观察 大多数邮件收集器技术水平不高,因此即使是最基础的混淆技术也能提供有效的保护。理想的策略是结合多种技术,将邮件地址分段并分别保护。 Linux 平台 Steam 用户份额飙升 市场份额创新高 Valve 最新的 Steam 调查数据显示,2026 年 3 月,Steam 在 Linux 平台的使用份额达到 5.33%,创下历史新高。这一数字是 macOS 平台(2.35%)的两倍多。相应地,Windows 的市场份额下降至 92.33%。 Steam Deck 的推动作用 社区普遍认为,此次增长主要归功于 Steam Deck 的普及。这款运行 Linux 操作系统的掌上游戏机让更多用户体验到了 Linux 游戏。在 Linux 游戏玩家中,约四分之一正在使用 Steam Deck 的操作系统 Steam OS。 数据准确性讨论 也有观点对 Steam 调查数据的准确性提出疑问,认为其历史数据存在波动。本次飙升可能部分源于 Valve 修正了 Steam 中国的数据。当月,简体中文语言的使用量大幅下降,而英文使用量则显著增加。 OCaml 编译器迎来新的 C++ 后端 项目目标 OCaml 编译器新增了一个 C++ 后端,旨在将 OCaml 程序翻译成可读的 C++ 代码,以改进其现有的 C 语言运行时和外部函数接口(FFI)。 实现方式与挑战 该后端大量使用 C++ 的模板元编程技术,在编译时生成代码。由于生成的代码遵循纯函数式范式,不依赖可变状态,因此无法直接使用包含大量可变操作的 OCaml 标准库。在性能方面,使用 g++ 编译器处理长时间计算时会消耗大量时间和内存,而 clang++ 则可能直接崩溃。 社区观点与改进 社区中有评论提出,相比于模板元编程,为何不使用 C++ 的 constexpr 特性在编译时直接计算出结果,并将其作为静态数据嵌入二进制文件。项目作者也提到,通过将内置算法从“埃拉托斯特尼筛法”更换为更高效的实现,计算性能得到了显著提升。 瑞典学校回归纸质书本 瑞典的教育转向 瑞典政府宣布其学校将“回归基础”,重新强调阅读、写作等基本技能。为此,政府投入上亿美元为学生购买实体教科书,并在低年级课堂中重新引入纸笔手写教学,同时计划在小学实施手机禁令。 数字化教育的争议 这一转变源于对课堂数字化效果的质疑,以及对屏幕时间过长、学生注意力分散和深度阅读能力下降的担忧。有研究表明,对于说明性文本,纸质阅读的学习效果优于屏幕阅读。教育技术专家 Jonathan Haidt 甚至称,在 K-12 课堂中普及电脑可能是“教育史上代价最昂贵的错误之一”。 “重新校准”而非倒退 瑞典官员强调,此举并非要完全抛弃数字技术,而是“重新校准”。目标是在学生掌握了基础读写技能后,再在合适的年龄段、有选择性地引入数字工具,培养学生的数字能力。 Artemis II 任务成功发射 任务概述 美国国家航空航天局(NASA)的 Artemis II 任务已成功发射。这是一次为期约 10 天的载人试飞任务,四名宇航员将搭乘 Orion 飞船环绕月球并返回地球。这是 Artemis 重返月球计划中的首次载人飞行。 发射日关键流程 发射日当天,团队完成了对 SLS 火箭的液态氢和液态氧燃料加注。宇航员进入 Orion 飞船并完成各项检查后,火箭顺利升空。升空后,固体火箭助推器和核心级按计划分离,Orion 飞船的太阳能电池板也成功展开。 后续步骤 任务接下来的关键里程碑包括提升飞船轨道的机动操作,以及测试飞船在深空中的手动操纵能力。此次任务将为后续的月球登陆乃至火星探索铺平道路。 SpaceX 申请上市 内容无法访问 《纽约时报》关于 SpaceX 申请上市的文章无法访问,页面返回 403 Forbidden 错误。因此,我们暂时无法提供该事件的详细摘要和社区讨论。 相关链接: * Artemis II Launch Day Updates * LinkedIn is illegally searching your computer * Steam on Linux Use Skyrocketed Above 5% in March * Sweden goes back to basics, swapping screens for books in the classroom * Quantum computing bombshells that are not April Fools * A new C++ back end for ocamlc * SpaceX files to go public * Email obfuscation: What works in 2026? * Google releases Gemma 4 open models * Subscription bombing and how to mitigate it
260331|NPM库遭入侵,谷歌时序AI模型Hacker News 今日精选:流行的 Axios 库遭遇供应链攻击,NASA 阿尔忒弥斯 2 号任务的安全性引发激烈讨论,同时 Ollama、谷歌和 Claude 社区也带来了 AI 领域的新动向。 Axios 遭遇供应链攻击,恶意版本植入木马 事件概述 JavaScript HTTP 客户端库 Axios 在 npm 上遭遇了一次复杂的供应链攻击。攻击者通过劫持维护者账户,发布了 axios@1.14.1 和 axios@0.30.4 两个恶意版本。这些版本通过一个名为 plain-crypto-js@4.2.1 的隐藏依赖,在用户安装时自动部署一个跨平台的远程访问木马 (RAT)。 攻击技术分析 攻击者手法精密,具有很强的反取证能力。恶意依赖包 plain-crypto-js 在 Axios 新版本发布前 18 小时就已发布,以规避安全扫描。它伪装成合法的 crypto-js 库,并包含一个混淆过的 RAT 投递器。该投递器会联系命令与控制服务器,根据受害者的操作系统(macOS、Windows 或 Linux)投递相应的载荷。 为了隐藏踪迹,恶意软件在执行后会删除自身,并将 package.json 文件替换为一个干净的诱饵文件,该文件报告一个旧的版本号,使开发者通过 npm list 等工具检查时难以发现异常。 恢复与防范建议 安装了恶意版本的用户应假定系统已被感染。建议立即降级 Axios 并固定版本,同时在 package.json 中配置 overrides 或 resolutions 防止依赖解析到恶意版本。 用户应手动检查并删除 node_modules 中的 plain-crypto-js 目录。若发现 RAT 相关的恶意文件,应从已知良好状态重建系统,并轮换所有受影响系统上的凭证,包括 npm 令牌、云访问密钥和 SSH 密钥。作为长期策略,在 CI/CD 流水线中使用 npm ci --ignore-scripts 可以阻止 postinstall 脚本的自动执行。 专家称 NASA 阿尔忒弥斯 2 号任务存在致命安全隐患 隔热罩的致命缺陷 “阿尔忒弥斯 2 号”(Artemis II)计划搭载四名宇航员绕月飞行,但其猎户座飞船的隔热罩存在严重安全隐患。在 2022 年的“阿尔忒弥斯 1 号”无人任务中,飞船返回地球时,隔热罩出现大块材料剥落,留下了深沟和孔洞,并非 NASA 最初声称的轻微“炭化材料损耗”。 美国国家航空航天局总检察长办公室 (OIG) 的报告指出三项可能导致宇航员丧生的问题:隔热罩剥落可能导致船体烧穿;剥落的碎片可能撞击并损坏降落伞舱;嵌入隔热罩的分离螺栓因加热模型缺陷而熔化,可能导致飞船在再入大气层时解体。 NASA 的应对与双重标准 NASA 承认找到了隔热罩损坏的根本原因,并声称通过调整再入轨迹足以解决问题,对任务安全性充满信心。然而,NASA 同时宣布将从“阿尔忒弥斯 3 号”开始更换新的隔热罩设计,这让外界感到困惑。 社区评论指出,如果商业载人飞船公司遇到同样问题,NASA 会立即要求重新设计并进行无人试飞验证。但对于自己的旗舰项目,NASA 似乎采取了双重标准。前宇航员 Charles Camarda 认为,NASA 正在重蹈“哥伦比亚”号和“挑战者”号的覆辙,用“玩具模型”为既定结论寻找支持,这种决策缺乏物理依据。 载人飞行的必要性受质疑 最初,“阿尔忒弥斯 2 号”是登月前唯一一次载人风险测试。但 NASA 增加了新的地球轨道任务,并将首次登月推迟到“阿尔忒弥斯 4 号”,这使得“阿尔忒弥斯 2 号”的载人飞行失去了原本的理由。该任务完全可以转为无人飞行,以获取数据并验证隔热罩模型,而不必危及宇航员生命。 文章认为,在耗资巨大的登月计划面临多重压力的情况下,NASA 的管理者可能为了维护项目进度和声誉,选择了“自圆其说”,而不是承认猎户座飞船需要一次真正成功的月球再入速度飞行测试。 Ollama 预览版利用 MLX 框架加速 Apple Silicon 设备 MLX 带来的性能提升 Ollama 的最新预览版 0.19 现已通过苹果的机器学习框架 MLX 在 Apple Silicon 设备上实现加速。MLX 利用 Apple 统一内存架构,为所有 Apple Silicon 设备带来了显著的速度提升。在 M5 系列芯片上,Ollama 还利用新的 GPU 神经网络加速器,提高了模型的响应速度和生成速度。 测试显示,使用阿里巴巴的 Qwen3.5-35B-A3B 模型,预填充性能从 1154 tokens/s 提升至 1810 tokens/s,解码性能也从 58 tokens/s 提升到 112 tokens/s。 新增特性与改进 新版本引入了对 NVIDIA NVFP4 格式的支持。这是一种低精度浮点格式,能在保持模型精度的同时,减少内存带宽和存储空间占用。 此外,Ollama 的缓存机制也得到改进,降低了内存占用,并采用更智能的淘汰策略,提高了编码和代理任务的效率。用户需要下载 Ollama 0.19 预览版,并确保 Mac 设备拥有超过 32GB 的统一内存来体验这些新特性。 CLAUDE.md:用一个文件精简 Claude 的冗余输出 项目定位:解决输出冗余 开源项目 CLAUDE.md 提供了一个简单的解决方案,用于减少大型语言模型 Claude 的输出冗余。用户只需在项目根目录放置一个名为 CLAUDE.md 的文件,就可以修改 Claude 的行为,使其输出更简洁、直接,平均可削减约 63% 的字数。 该方案旨在解决 Claude 输出中常见的客套话、重复内容、不必要的格式化以及过度工程化的代码建议等问题。这些问题都会消耗不必要的 tokens,增加成本。 核心能力与测试效果 CLAUDE.md 通过一系列规则强制执行更简洁的输出,例如要求答案总是在第一行、禁用免责声明、强制使用 ASCII 字符等。基准测试显示,在相同的提示下,使用 CLAUDE.md 后,Claude 的输出字数平均减少 63%。例如,一个代码审查任务的输出从 120 字减少到 30 字。 社区用户建议,应根据实际遇到的问题来制定具体规则,例如“当步骤失败时,立即停止并报告完整错误”,这种具体指令比泛泛的“保持简洁”更有效。 适用场景与局限 CLAUDE.md 最适用于高输出量的自动化流程,如代码生成或代理循环。对于单个简短查询,该方法可能不划算,因为 CLAUDE.md 文件本身会占用输入 tokens。此外,对于需要保证可解析输出的场景,使用 API 内置的 JSON 模式等结构化输出功能是更可靠的解决方案。 谷歌开源 2 亿参数时间序列基础模型 TimesFM 模型定位与核心能力 Google Research 推出了 TimesFM,一个用于时间序列预测的预训练基础模型。该模型参数量为 2 亿,能处理长达 16k 的上下文,并支持最长 1k 预测范围的分位数预测。TimesFM 已通过 Hugging Face 提供,并集成到 Google Cloud 的 BigQuery 中。 新版特性 相比旧版,最新的 2.5 版本参数量更少,但上下文长度更长。它移除了对 frequency 指示器的依赖,并增加了新的预测标志,同时重新加入了对协变量的支持,使模型能整合外部相关变量进行预测。 如何使用 用户可以通过 GitHub 仓库安装 TimesFM,支持 PyTorch 和 Flax 后端。示例代码展示了如何加载模型并配置预测参数,模型可同时输出点预测和分位数预测结果。该项目采用 Apache-2.0 许可证。 为什么 ATProto 协议值得期待 现有社交媒体的困境 当前主流社交平台以广告为盈利模式,导致算法倾向于推荐最具分裂性的内容以增加用户停留时间。这使得平台变得孤立,充斥着广告和仇恨信息。用户数据被当作商品,人们失去了对时间的自主权和真实的社交连接。 ATProto 的解决方案:数据可移植性 ATProto (Authenticated Transfer Protocol) 是 Bluesky 等应用的底层去中心化协议。其核心理念是用户拥有自己的数据,包括社交关系、帖子和评论。用户可以将数据存储在自己的个人数据服务器 (PDS) 上,自由切换不同的 ATProto 应用而不会丢失任何内容或关注者。这种设计避免了平台锁定,让用户真正拥有对自己数据的控制权。 社区活力与未来展望 ATProto 社区展现出独特的跨学科活力,汇聚了记者、科学家和开发者,共同探讨如何利用该协议改善科研数据管理和新闻分享等领域。社区强调互操作性和合作,开发者乐于为共同目标努力,而非单纯追求个人利益。有社区用户评论,真正能改变互联网的协议,是那些认真对待“不仅仅为开发者服务”这一理念的协议,而 ATProto 似乎正在这样做。 Railway 平台发生 CDN 意外缓存事故 事件概述 云部署平台 Railway 发生了一起意外事故,导致部分用户的认证数据被 CDN 错误缓存,并可能提供给未认证用户。事故持续了 52 分钟,影响了约 0.05% 原本禁用 CDN 的域名。 根本原因与解决方案 事故的根本原因是,一项旨在启用“代理键”功能的配置更新,错误地为本应禁用 CDN 的域名启用了缓存。这导致包含认证信息的响应被存储在边缘服务器上。 为防止此类事件再次发生,Railway 已增加部署前的额外测试,并将 CDN 部署的变更过程从几分钟延长到数小时,以便逐步进行。Railway 已向受影响的用户发送邮件通知,并表示将暂时放缓新功能开发以重建用户信任。 研究人员发现 3500 年前织机,揭示青铜时代纺织革命 关键发现 西班牙研究人员在青铜时代的卡贝索·雷东多聚居地发现了一台有 3500 年历史的织机。一场火灾奇迹般地保存了这台以木材为主结构的织机,使其成为地中海地区少数能同时保存织机坠子、木制部件和植物纤维的考古发现之一。研究人员确认这是一台竖式经线加重织机,由精心挑选的阿勒颇松木材制成。 技术与社会意义 这一发现与欧洲青铜时代的“纺织革命”紧密相关。这场革命涉及牲畜养殖扩大以获取羊毛、纺织工具的技术创新,以及社会生产方式的变革。这台完整的织机让研究人员得以从解读孤立的工具转向详细记录一台运作中的设备。 织机位于一个由多个家庭共享的户外空间,暗示纺织生产是一种合作性劳动。这与金属制品等手工业集中在专业区域的情况不同。生物人类学证据也表明,女性在纺织活动中扮演了核心角色。这项发现使卡贝索·雷东多成为研究青铜时代纺织技术和社会演变的卓越实验室。 相关链接: * Axios compromised on NPM – Malicious versions drop remote access trojan * Android Developer Verification * Universal Claude.md – cut Claude output tokens * Artemis II is not safe to fly * Ollama is now powered by MLX on Apple Silicon in preview * Incident March 30th, 2026 – Accidental CDN Caching * Google's 200M-parameter time-series foundation model with 16k context * Researchers find 3,500-year-old loom that reveals textile revolution * Clojure: The Documentary, official trailer [video] * I'm betting on ATProto
260330|Copilot PR广告门,费城法院禁智能眼镜今日 Hacker News 精选:Copilot 在代码中植入广告引发争议,AI 正将开放网络变为“认知黑暗森林”;同时,我们探讨独立浏览器的生存之道与自制路由器的乐趣。 Copilot 在代码合并请求中插入广告 事件概述 一名开发者报告,其团队成员在使用 GitHub Copilot 修正一个 Pull Request (PR) 中的拼写错误后,Copilot 自动在 PR 描述中添加了为其自身和 Raycast 设计的广告内容。 平台“垃圾化”的信号 这一行为被视为平台“垃圾化” (enshittification) 的一个实例。该理论由 Cory Doctorow 提出,描述了平台如何从服务用户转变为服务商业客户,最终牺牲所有人的利益以实现自身盈利。在代码协作工具中自动插入广告,被认为是一种越界行为,破坏了开发者社区的信任。 社区担忧 此事引发了开发者对 AI 编程助手边界的担忧。开发者工具应专注于提高效率和代码质量,而不是成为营销渠道。社区讨论认为,这种做法如果成为常态,将严重影响工作流程和工具的可信度。 认知黑暗森林的降临 核心观点 随着人工智能的普及,开放的互联网正演变为一个“认知黑暗森林”。在这个环境中,公开分享想法变得危险,因为大型平台可以利用 AI 迅速复制和吸收任何创新,扼杀小型创新者的生存空间。 论证逻辑 早期的互联网是一个鼓励分享的开放空间,因为“执行”创意的成本很高。如今,大型语言模型(LLM)大幅降低了执行门槛。一个新颖的想法一旦公开,拥有海量计算资源的公司就能轻易生成类似产品,使原创失去优势。 更进一步,开发者与中心化 AI 平台的每一次交互,无论是生成代码还是头脑风暴,都在提供“意图信号”。平台通过分析这些信号的聚合,可以在创新者自己意识到之前就发现新兴的需求和趋势。在这个森林里,最大的威胁不是其他开发者,而是“森林本身”,即 AI 平台系统。 延伸思考 面对这种局面,开发者可能选择“关上大门”,回归私下开发,但这会导致公共知识生态的衰落。另一种选择是继续创新,但这又会不断“喂养”这个系统,使其变得更强大。文章最后指出,即使是这篇警示文章本身,也已被“森林”吸收,成为其训练数据的一部分。 费城法院下周起禁止所有智能眼镜 事件概述 美国宾夕法尼亚州第一司法区宣布,从下周开始,将禁止任何带有音视频录制功能的智能眼镜进入其管辖的所有法院大楼。 禁令原因与影响 此举旨在保护证人和陪审员,防止他们受到潜在的录音和恐吓。由于智能眼镜难以被察觉,法院决定采取全面禁止措施。违反者可能被拒绝入内,甚至因藐视法庭罪被起诉。手机等其他设备虽允许带入,但必须保持关闭。 行业背景 费城是较早实施此类禁令的法院系统之一。随着 Meta 与雷朋合作的智能眼镜等产品变得普及且价格亲民,其在公共和敏感场所的使用引发了新的隐私和安全挑战。苹果公司也计划在 2027 年进入智能眼镜市场,相关规定可能会变得更加普遍。 Waterfox 浏览器 15 年的独立之路 项目起源 Waterfox 始于 15 年前,当时 16 岁的创始人因官方 Firefox 缺少 64 位版本而自行编译了一个。这个无心之举的浏览器在 2011 年发布后迅速流行,目前拥有约 100 万月活跃用户。 独立运营的挑战 作为一款注重隐私的独立浏览器,Waterfox 的商业模式充满挑战。近期,由于 Bing 终止了所有第三方搜索合作,项目遭受了沉重的财务打击,一度陷入亏损。这反映了独立浏览器在巨头主导的市场中生存的普遍困境。 未来方向 Waterfox 计划推出基于 Brave adblock-rust 库的原生内容拦截器,它比传统扩展运行更快、集成度更高。同时,项目明确表示不会整合 AI 功能,坚持浏览器应专注于核心任务:加载网页和保护用户数据。Waterfox 还加入了浏览器选择联盟,与其他独立浏览器共同争取更公平的市场环境。 复古 Demo 场景中的像素艺术演变 工艺胜于原创 在 Demo scene 早期,像素艺术的价值更多体现在“工艺”上,而非主题的原创性。由于扫描仪等设备昂贵且质量不佳,艺术家们通过手工逐个像素地绘制图像,即使是复制名家作品,其投入的巨大精力也被社区视为一种高超技艺的展示。 从复制到原创的转变 随着扫描仪和 Photoshop 等工具的普及,纯粹的复制变得轻而易举,社区的风气也随之改变。对“作弊”的抱怨增多,原创性开始受到重视。此时,“好的艺术家复制,伟大的艺术家偷窃”这句名言的真意被重新审视:重点在于将灵感内化,而非简单照搬。社区中也形成了“使用参考”和“直接复制”的明确区分。 AI 带来的新困境 如今,生成式 AI 成为新的“扫描仪”,再次挑战了社区的价值观。多数 Demo 聚会禁止使用 AI 生成的作品,因为这与 Demo scene 所崇尚的克服技术限制、展现人类创造力和高超技艺的精神背道而驰。使用 AI 被认为剥夺了创作的乐趣和作品的“灵魂”,尽管关于 AI 作为工具的讨论仍在继续。 使用 Excalidraw 扩展自动化博客图表管理 问题背景 为博客文章管理图表是一项重复性工作,尤其是需要为亮色和暗色模式分别导出图片时,每次修改都耗时且繁琐。 解决方案的演进 开发者首先尝试使用 GitHub Action 自动化导出流程,但该方案无法在本地预览,影响了开发体验。最终,他选择直接修改 Excalidraw 的 VSCode 扩展。现在,当他在 VSCode 中编辑 Excalidraw 文件时,任何以 export_ 为前缀命名的框架都会被自动、实时地导出为亮色和暗色两种模式的 SVG 文件。 应用场景 这个改进极大地简化了工作流,实现了图表的实时本地预览,显著提升了包含大量图表的博客文章的写作效率。开发者已将该扩展的构建文件分享在 GitHub,供有类似需求的用户使用。 如何将任何电脑变成路由器 问题背景 面对消费级路由器可能面临的政策限制,以及出于对网络控制和性能的追求,使用普通电脑自制路由器成为一个可行的选择。 解决方案 任何能运行 Linux 并拥有至少两个以太网接口的设备(如迷你 PC、旧笔记本电脑)都可以被改造成路由器。核心软件包括用于创建 Wi-Fi 的 hostapd、提供 DHCP/DNS 服务的 dnsmasq、用于网络桥接的 bridge-utils 以及配置防火墙和 NAT 的 nftables。 应用场景 文章提供了详细的配置步骤,包括系统安装、软件包配置、网络接口设置、IP 转发开启和防火墙规则设定。这种 DIY 方案提供了商业路由器无法比拟的灵活性和控制权,可以实现 VLAN、VPN、入侵检测等高级功能。社区讨论也补充,对于不熟悉命令行的用户,OpenWRT 或 OPNsense 等专用路由器系统是更友好的选择。 解读法国高速公路上的棕色路牌 路牌的起源 自 1972 年以来,法国高速公路旁的棕色指示牌一直在向游客介绍沿途的历史文化遗产。这些由设计师 Jean Widmer 创作的标志最初采用极简的象形图,旨在吸引司机离开高速公路,探索当地特色,同时也能让司机放慢速度,提高行车安全。 设计的演变 1980 年代,新一代设计师为路牌带来了更具绘画感和细节的风格。近年来,高速公路运营商开始更新这些标志,将重点扩展到历史上被忽视的人物和事件,如著名的法国女性和二战纪念馆。 持久的影响 尽管设计风格历经变迁,这些棕色路牌 50 多年来的核心目的始终未变:它们不仅是指引方向的工具,更是一堂关于法国历史与文化的移动速成课,丰富了人们的旅途体验。 VHDL 的核心优势:增量周期与确定性 研究发现 VHDL 作为一种硬件描述语言,其核心优势之一是其“增量周期”(delta cycle)算法保证了行为的确定性。确定性意味着在相同的输入下,仿真总能产生完全相同的结果。 方法简介 VHDL 通过将仿真过程严格分为两个阶段来实现确定性:首先,处理所有待更新的“信号”(signal)值;然后,在所有信号更新完成后,才评估那些被触发的“进程”(process)。这种分离确保了所有进程在同一时间点看到的是完全一致的系统状态,从而消除了竞争条件。 意义与局限 相比之下,另一种主流语言 Verilog 缺乏这种严格的阶段分离,其事件处理顺序可能因仿真器实现而异,导致非确定性行为。虽然 Verilog 的非阻塞赋值可以在一定程度上缓解此问题,但 VHDL 的增量周期机制从根本上提供了更强的确定性保证,这在设计复杂的数字系统和测试平台时尤为重要。 从强化学习到扩散模型:HJB 方程的统一视角 研究发现 Hamilton-Jacobi-Bellman (HJB) 方程作为一个核心的偏微分方程,为连续时间的强化学习(RL)、随机控制和现代的扩散模型提供了统一的理论框架。 HJB 与强化学习 HJB 方程是强化学习中贝尔曼方程在连续时间下的推广。它构成了连续时间 RL 算法(如策略迭代和 Q-learning)的理论基础,能够解决金融领域的投资组合优化等经典问题。 HJB 与扩散模型 研究揭示,扩散模型的逆向采样过程(从噪声生成数据的过程)可以被视为一个随机最优控制问题。描述该问题价值函数的演化方程,正是 HJB 方程。这个视角表明,扩散模型学习的“得分函数”(score function)实际上对应着最优控制策略。这不仅为扩散模型提供了深刻的理论解释,也揭示了其损失函数(如 ELBO)与控制误差之间的内在联系。 相关链接: * Copilot edited an ad into my PR * The Cognitive Dark Forest * Philly courts will ban all smart eyeglasses starting next week * 15 Years of Forking * The curious case of retro demo scene graphics * I use Excalidraw to manage my diagrams for my blog * How to turn anything into a router * The road signs that teach travellers about France * VHDL's Crown Jewel * Hamilton-Jacobi-Bellman Equation: Reinforcement Learning and Diffusion Models
260329|开源AI工具,管理文件系统,Verilog编译Factorio RISC-V今日 Hacker News 精选:能运行任意模型的本地 AI 助手 OpenYak;能识别“说谎”线缆的 USB 测试仪;用 Verilog 在《异星工厂》里构建 RISC-V 处理器;以及如何将你的 Kindle 变身个人日报。 开源桌面 AI 助手 OpenYak:本地优先,支持任意模型 项目定位:私密的个人 AI 协作工具 OpenYak 是一款开源的桌面 AI 助手,专为注重隐私的用户设计。它以“本地优先”为核心,所有数据处理和存储均在用户本地完成,不上传云端,杜绝遥测。该工具将自己定位为一个“协作(Cowork)”伙伴,能够运行任何模型并直接访问和管理本地文件系统。 核心能力:广泛模型支持与多平台集成 OpenYak 通过 OpenRouter 平台支持超过 100 种 AI 模型,同时兼容 OpenAI、Google、Groq 等 20 多家服务商的 API 密钥。用户还可以直接连接自己的 ChatGPT 订阅,无需额外支付 API 费用。 该助手内置文件管理、数据分析、网络抓取等 20 多种工具。其一大亮点是通过 OpenClaw 网关,集成了 WhatsApp、Discord、Telegram、Slack 等 8 个主流即时通讯平台,让 AI 可以在一个统一界面处理所有渠道的消息。 技术与社区观察 OpenYak 基于 Tauri 框架构建,前端使用 Next.js,后端使用 FastAPI。社区普遍认为,其 100% 本地优先的特性是最大吸引力。多平台消息集成功能被认为很有前景,但也有人对其安全性和本地化程度提出疑问。由于所有计算都在本地执行,该应用的实际运行性能将是用户体验的关键。项目采用 AGPL-3.0 许可证,确保其开源精神得以延续。 找到近乎完美的 USB 线缆测试仪 问题背景:USB 线缆功能混乱 许多用户都拥有大量 USB 线缆,但很难确定它们实际支持的充电功率和数据传输速度。即使电脑报告了高连接速度,线缆的物理线路也可能并不支持,导致实际性能远低于预期。之前的 LED 测试仪需要查阅手册才能看懂,而通过系统命令查看也并不可靠。 解决方案:Treedix 测试仪 作者发现了一款名为 Treedix 的 USB 线缆测试仪。它配备 2.4 英寸彩色屏幕,能清晰直观地显示线缆的详细信息。测试仪支持 USB-A、USB-C、Mini、Micro 等多种接口,可以读取线缆内置的 eMarker 芯片信息、测量电阻,并显示内部数据通道的连接情况。 意外发现:“说谎”的线缆 使用这款测试仪后,作者发现了一些“欺骗性”线缆。这些线缆的 eMarker 芯片声称支持 20Gbps 的高速度,但其物理接线实际上只支持 USB 2.0。当用这些线缆连接设备时,电脑会相信 eMarker 芯片报告的高速度,尽管物理上无法达到。作者认为,单是识别出这些“说谎”线缆,就已经值回 45 美元的测试仪票价。 在《异星工厂》中用 Verilog 构建 RISC-V 处理器 项目定位:将硬件描述语言编译进游戏 一个名为 v2f 的开源项目,可以将硬件描述语言 Verilog 编译成游戏《异星工厂》(Factorio)中的组合电路蓝图。这意味着玩家可以用工业级的语言来设计复杂的逻辑电路,然后直接在游戏中构建和模拟。 核心亮点:成功运行 RISC-V 核心 该项目最引人注目的成就是成功编译并运行了一个功能完整的 32 位 RISC-V 处理器(RV32IM)。这个处理器在《异星工厂》中成功运行了 "hello_world" 程序,充分展示了游戏环境的图灵完备性。社区成员对这一技术实现表示惊叹,并对未来能否直接将 C 语言编译到这个游戏内的 CPU 上运行充满期待。 实用工具:可视化与模拟 v2f 不仅能生成游戏蓝图,还能在游戏外模拟电路运行,并生成 SVG 图像来可视化电路布局和信号状态。用户无需启动游戏就能快速预览和调试设计。项目提供了网页 GUI、Lua API 和命令行等多种使用方式,方便不同背景的用户上手。 我把 Kindle 变成了个人日报 问题背景:昂贵的电子墨水屏设备 作者希望使用对眼睛友好的电子墨水屏设备来阅读网页文章,但发现市面上的安卓电子墨水屏平板价格高昂。于是,他决定改造自己闲置的亚马逊 Kindle 阅读器。 解决方案:Readeck + Calibre 工作流 由于 Kindle 无法直接打开网页或阅读主流的 .epub 电子书格式,作者设计了一套工作流: 1. 收集文章:使用自托管的“稍后阅读”服务 Readeck 保存感兴趣的网页链接。Readeck 的解析器能很好地提取文章正文。 2. 生成与转换:每天将 Readeck 中的文章列表导出为一个 .epub 文件。然后,在电脑上使用免费的电子书管理软件 Calibre,将 .epub 文件转换为 Kindle 支持的 .mobi 格式。 3. 传输阅读:通过 USB 将转换好的文件传输到 Kindle 上,形成一份定制的“个人日报”。 体验与取舍 这个方法让作者以极低的成本获得了接近昂贵电子墨水屏平板 90% 的阅读体验。主要缺点是需要依赖电脑进行格式转换和文件传输。社区用户建议,可以利用 Calibre 的“获取新闻”功能和脚本实现自动化,定期抓取 RSS 源并生成 Kindle 文件,进一步简化流程。对于有网络连接的 Kindle,亚马逊官方的“Send to Kindle”服务也是一个方便的选择。 回顾那台 667MHz 的奔腾 III 电脑 物理与数字世界的维护 文章作者回顾了在 90 年代使用一台 667MHz 奔腾 III 电脑的经历。那时的电脑需要持续的物理维护,比如定期打开机箱清理灰尘,小心处理脆弱的 PS/2 接口引脚。数字系统同样需要照料:每月进行磁盘碎片整理,停电后等待缓慢的 ScanDisk 磁盘扫描,还要忍受耗时且拖慢系统的杀毒软件全盘扫描。 昂贵且稀缺的互联网 互联网接入是那个时代的另一大挑战。56kbps 的拨号上网速度缓慢、噪音大,并且按分钟计费。下载一首 5MB 的歌曲需要约 15 分钟。由于上网时间有限,用户养成了快速拨号、查看信息、开始下载然后立即断开的习惯。不稳定的网络连接也让许多人养成了“数据囤积”的习惯,因为他们知道在线资源随时可能消失。 塑造人生的数字窗口 尽管充满限制,但这台电脑和它所连接的互联网依然为作者打开了新世界的大门。他通过 IRC 和论坛与世界各地的人交流,学习 HTML 和 Photoshop,也曾涉足早期网络安全领域。这段在 CRT 显示器前摸索的经历,最终演变为通过为游戏服务器设计网页来赚钱的技能,并塑造了他的人生道路。 “猫体工学”:如何为猫设计更好的窗箱 核心观点:猫的“渐进式隐藏”需求 文章认为,现有的猫活动空间设计大多以人类为中心,未能充分考虑猫的本能。猫有一种“渐进式隐藏”(progressive concealment)的需求,它们需要能够持续观察外部世界,同时也能随时调整自身的暴露程度,以维持在最佳的风险与刺激水平。这种行为由“风险补偿”心理驱动,并且同时涉及视觉和听觉。 现有设计的缺陷 目前市场上的猫窗箱或“猫舍”(catios)大多是“全有或全无”的设计。它们通常使用透明玻璃或纱窗,让猫要么完全暴露在外,要么完全不在其中,缺乏对可见度和声音强度的精细控制。这种设计忽视了猫的敏感天性,可能给它们带来不必要的焦虑。 改进的设计原则与方案 文章提出了五项设计原则,包括提供不同暴露程度的“渐变性”、分别控制视觉和听觉的暴露、以及利用猫喜欢狭窄高耸空间的偏好。基于这些原则,作者提出了一种“双层猫窗箱”方案: * 外部箱体:部分透明,部分不透明,让猫可以通过改变姿势(站立或躺下)来调整自己的可见度。 * 内部箱体:通过一个狭窄的“舷窗”与外部相连,提供更强的隐蔽性,让猫可以只听不见或通过小缝隙观察。 这种设计为猫提供了对环境刺激的精细控制权,创造出更符合其天性的安全空间。 相关链接: * OpenYak – An open-source Cowork that runs any model and owns your filesystem * Technology: The (nearly) perfect USB cable tester does exist * Alzheimer's disease mortality among taxi and ambulance drivers (2024) * OpenBSD on Motorola 88000 Processors * A Verilog to Factorio Compiler and Simulator (Working RISC-V CPU) * The 667MHz Machine * The ANSI art "telecomics" of the 1992 election * A laser-based process that enables adhesive-free paper packaging * I turned my Kindle into my own personal newspaper * Cat Itecture: Better Cat Window Boxes (2023)
260327|苹果停产Mac Pro,500刀显卡超越ClaudeHacker News 今日精选:本地AI系统展示强大潜力,硬件市场重心悄然转移,开发者工具迎来性能革新。 500美元消费级GPU在编码测试中击败Claude Sonnet 本地AI系统的潜力 一个名为ATLAS的项目展示,通过一块价值500美元的消费级NVIDIA RTX 5060 Ti GPU,一个参数量仅为14B的本地模型在LiveCodeBench代码基准测试中取得了74.6%的成绩,超越了Anthropic的Claude Sonnet模型(71.4%)。这表明,强大的AI能力不一定依赖于大型云服务商。 ATLAS系统完全自托管,所有数据在本地处理,无需API密钥和按量付费。它以稍高的延迟换取了极低的成本和数据隐私,估算每项任务的电力成本仅为0.004美元,远低于Claude Sonnet的0.066美元。 智能基础设施是关键 ATLAS的成功不在于模型本身,而在于其围绕模型构建的智能基础设施。该系统采用多阶段流程: 1. 生成:通过约束驱动生成多样化的解决方案。 2. 验证:利用模型自身的嵌入向量对候选方案进行能量评分,选出最佳方案并在沙箱中执行。 3. 修复:如果所有方案失败,系统会通过自我验证和迭代修复机制,让模型自己生成测试用例并修正代码,直到通过为止。 未来规划 目前ATLAS主要针对LiveCodeBench优化。未来计划切换到更高效的模型架构,并扩展到更广泛的编码、推理和通用知识基准测试,旨在打造一个通用的自托管AI系统。 珍惜你手中的硬件 行业重心转向数据中心 硬件行业正经历结构性转变,重心从消费者市场转向数据中心和AI公司。大型云服务商和AI企业对DRAM、HBM和NAND闪存的需求巨大,导致主要制造商的产能提前数年售罄。例如,OpenAI的“Stargate”项目预计将消耗全球DRAM总产量的40%。 这并非周期性短缺,而是全球硅晶圆产能的永久性战略再分配。与手握数十亿美元合同的“超大规模”买家相比,普通消费者已成为次要客户。 消费者硬件的未来 这一转变对消费者的影响是硬件价格上涨、选择减少。制造商将成本转嫁给消费者,表现为更高的零售价、更低的基础配置,并且越来越多的组件被焊死在主板上,使升级变得不可能。 西部数据、铠侠等公司高管证实,其2026年全年的产能已全部预售给企业客户。消费级硬件正在沦为“二等公民”。 “租赁计算”的兴起 文章预示了一个“租赁计算”的未来,硬件所有权被云平台和SaaS订阅取代。消费者可能需要租赁CPU算力、内存积分和存储配额。HP推出的笔记本电脑订阅服务被视为这一趋势的早期信号。 文章最后敦促消费者维护和升级现有硬件,因为未来的替换成本可能高昂。现在升级内存和存储,或许是应对未来不确定性的一种保险。 苹果正式停产 Mac Pro Mac Studio 成为新旗舰 苹果已确认停止生产Mac Pro,并将其从官网下架。这款曾代表苹果最高性能的台式机在2023年更新至M2 Ultra芯片后,便再未获得升级,而定位稍低的Mac Studio已搭载更强的M3 Ultra芯片。 Mac Studio被视为苹果专业级台式机的新核心。许多社区用户认为,Mac Studio正是他们期待已久的“更小巧、纯粹关注性能”的Mac Pro替代品。 对可定制化的讨论 Mac Pro的停产引发了关于用户可定制化需求的讨论。有观点认为,这与iPhone mini的命运相似:人们口头上需要可定制、可升级的Mac,但实际购买时更倾向于Mac mini或Mac Studio。 另一些用户则反驳称,问题在于苹果未能提供一款足够有吸引力的Mac Pro。Mac Pro曾是唯一支持超大内存(高达1.5TB)且允许用户自行升级的Mac。它的停产被视为苹果进一步限制用户自主权的体现。 专业用户的选择 尽管部分用户对失去PCIe扩展插槽和内部升级选项感到失望,但也有专业人士指出,Thunderbolt 5等高速接口已为大多数外设提供了足够带宽,且Mac Studio在重负载下依然能保持出色的散热。真正的专业用户通常依赖质保服务,很少自行升级内部组件。 7美元VPS上运行的IRC AI代理 双代理安全架构 一位开发者展示了如何在每月7美元的VPS上部署一个AI代理系统,并巧妙地利用IRC作为通信协议。该系统采用双代理架构以保障安全: * nullclaw:一个公共“门卫”代理,运行在最小化的服务器上,处理初步问询,并能克隆GitHub仓库以代码来验证回答。 * ironclaw:一个私有代理,运行在独立的强大系统上,拥有访问私人数据(如邮件)的权限,处理由nullclaw转来的复杂请求。 这种设计确保了面向公众的服务器无法访问任何敏感数据。 为何选择IRC与分层模型 选择IRC作为传输层的原因有三:美学统一、对整个技术栈的完全所有权,以及IRC协议的成熟稳定。社区普遍赞赏这种避免依赖第三方平台的做法。 在模型选择上,系统采用了“分层推理”策略以控制成本:简单会话使用响应快、成本低的Haiku模型,而需要代码分析等复杂推理时才调用更强大的Sonnet模型,并设置每日2美元的硬性成本上限。 A2A通信设计 nullclaw与ironclaw之间的代理到代理(A2A)通信设计是该项目的一大亮点。nullclaw不持有自己的API密钥,而是将其LLM请求通过一个安全的内部网络(Tailscale)透传给ironclaw。这意味着只有一个API密钥需要管理,并且由持有密钥的私有代理支付所有推理费用。这种“谁有密钥谁付费”和严格的权限隔离设计,为未来的A2A应用提供了宝贵经验。 Whistler:在 Lisp REPL 中进行实时 eBPF 编程 简化 eBPF 开发流程 Whistler是一个基于Common Lisp的领域特定语言(DSL),它允许开发者直接从Lisp的REPL(交互式命令行)中进行实时eBPF编程。它旨在将传统eBPF开发的双语言、多步骤工作流(通常是C语言编写内核侧,Go/Rust/Python编写用户侧)简化为单一的Lisp环境。 REPL驱动的实时反馈 Whistler最大的优势在于极大地缩短了开发反馈周期。开发者可以在REPL中即时修改探针代码,重新评估表单,并立即看到结果,无需经历编译、加载、运行等多个步骤。整个过程在单个Lisp进程内完成,BPF字节码甚至无需写入磁盘。 内核与用户空间无缝集成 Whistler通过bpf:前缀区分内核与用户空间代码,并在编译时将Lisp代码转换为优化的eBPF字节码。它还能自动从运行中的内核导入数据结构定义(BTF),确保内核与用户空间数据结构的一致性,无需手动处理偏移量或依赖内核头文件。项目还包含一个纯Lisp编写的eBPF加载器,可以直接进行系统调用,没有任何C语言依赖。 比 Jq 更快的 JSON 查询工具:jsongrep DFA驱动的查询引擎 jsongrep是一款新的JSON路径查询工具,其性能在许多场景下都优于广受欢迎的jq。其核心优势在于,它将用户的查询语句编译成一个确定性有限自动机(DFA)。 与传统递归解析路径的工具不同,DFA允许jsongrep在一次遍历JSON文档树的过程中,以O(1)的恒定时间处理每个节点,无需回溯。这使得它在处理大型JSON文件和复杂查询时速度极快。 性能优势与实现细节 jsongrep的引擎包含解析、构建NFA、转换为DFA、搜索等多个阶段。它使用零拷贝解析技术来加载JSON,并通过深度优先遍历结合DFA状态转换来搜索。如果某个分支不匹配查询,整个子树会被立即“剪枝”,显著提升效率。 基准测试显示,虽然jsongrep在查询编译阶段有额外开销,但在搜索时间上远超同类工具,尤其是在处理超过100MB的大型数据集时。 适用场景与局限 jsongrep专注于搜索,支持点路径、通配符、递归下降等查询。它的表达能力不如jq,不提供数据转换、过滤或算术运算功能。对于需要快速从大型JSON文件中提取数据的场景,jsongrep是一个出色的选择。 Claude推出Web端定时任务 云端自动化的新选择 Claude Code推出“Web端调度任务”功能,允许用户在Anthropic托管的基础设施上自动运行重复性工作。这意味着即使用户的电脑关闭,任务也能可靠执行,例如每日审查代码合并请求、分析CI失败报告或每周审计依赖项。 如何创建与管理任务 用户可以通过Web界面创建任务,只需命名任务、编写提示词、选择GitHub代码库、配置云端环境(包括API密钥等敏感信息)和设置调度频率。每次任务运行都会生成一个新的会话,用户可以审查Claude的操作、查看代码更改或继续对话。 场景对比与考量 这项新功能与已有的桌面任务和CLI中的/loop命令形成互补。云端任务适合需要可靠执行且不依赖本地环境的场景,但最小调度间隔为1小时,可能不适用于需要更高频率触发的用例。社区用户也提醒,在云端环境中使用API密钥时,需要特别注意安全性和权限控制。 法院阻止五角大楼将 Anthropic 列为供应链风险 裁决概述 加州一名联邦法官颁布禁令,阻止美国国防部将AI公司Anthropic标记为“供应链风险”。法官裁定,五角大楼此举侵犯了Anthropic受宪法保护的言论自由和正当程序权利。 争端背景 这起争端的起因是Anthropic拒绝在合同中放弃其AI模型(Claude)不得用于自主武器和大规模监控的“护栏”政策。作为回应,国防部采取了前所未有的措施,将这家美国公司列为供应链风险,并命令联邦机构停止使用其产品。该标签此前通常用于与外国对手有关联的公司。 对言论自由的保护 法官在裁决中指出,国防部的行为是对Anthropic坚持其安全政策并向媒体公开此事的报复,而非出于真正的国家安全考虑。裁决明确表示,不能仅仅因为一家美国公司“表达与政府的不同意见”就将其贴上“潜在对手”的标签。国防部表示计划上诉。 Anthropic 更新分包处理方列表 新增合作伙伴 作为其透明度承诺的一部分,AI公司Anthropic更新了其分包处理方(Subprocessor)列表,新增了三家公司: * Microsoft Azure:提供全球范围的云基础设施服务。 * Nutun(南非):提供用户支持服务。 * Boldr(加拿大):提供用户支持服务。 透明度与合规承诺 此次更新是Anthropic持续努力的一部分,旨在向客户清晰展示其数据处理和安全实践。公司的“信任中心”提供了包括SOC 2、ISO 27001、FedRAMP High等多项合规认证的详细信息。这些举措反映了Anthropic在全球扩展服务的同时,对安全和透明度的重视。 “文件洪水”:如何用技术对抗官僚主义 荒谬的要求 一位自出生就失明的作家分享了他如何应对政府的“持续性残疾审查”。他收到信件,要求提供“最新的医疗证据”来证明他仍然失明。政府官员拒绝接受电子邮件提交,并坚持要求他通过邮寄或传真发送实体文件。 恶意的合规 这位作家没有选择争辩,而是采取了“恶意合规”的策略。他利用一项互联网传真服务,将自己从五岁至今的所有医疗记录、手术报告和诊断笔记汇编成一个长达512页的PDF文件,并将其发送到政府办公室的传真机上,同时将重试次数设为“无限”。 传真机的末日 两个小时后,他接到了那位政府官员气喘吁吁的电话,请求他停止传真,因为办公室的传真机已经卡纸并耗尽了墨粉。作者假装无辜地表示,这是一个无法中途停止的“自动化安全流程”,以确保文件完整性。最终,对方无奈地同意将他的文件标记为已更新。这次行动是用技术对僵化官僚系统的巧妙反击。 相关链接: * Show HN: I put an AI agent on a $7/month VPS with IRC as its transport layer * Apple discontinues the Mac Pro * Schedule tasks on the web * Hold on to Your Hardware * A Faster Alternative to Jq * Judge blocks Pentagon effort to 'punish' Anthropic with supply chain risk label * Whistler: Live eBPF Programming from the Common Lisp REPL * $500 GPU outperforms Claude Sonnet on coding benchmarks * Anthropic Subprocessor Changes * The 'paperwork flood': How I drowned a bureaucrat before dinner
260326|欧盟叫停聊天监控,RAG系统实践成败Hacker News 今日精选:从零搭建企业级 RAG 系统,用 AI 整理个人生活史;Swift 6.3 正式发布,并深入探讨了编译器优化、学术诚信及欧盟数字隐私的最新动态。 从零到 RAG 系统的实践与教训 锁定技术栈 一位工程师分享了为公司构建本地 RAG(检索增强生成)系统的经历。目标是让内部员工能通过自然语言查询公司十年来积累的 1TB 技术文档。出于保密性,团队选择了本地部署方案:Ollama 运行 LLM,nomic-embed-text 生成文档嵌入,LlamaIndex 作为 RAG 框架,ChromaDB 负责向量存储,前后端则分别使用 Flask 和 Streamlit。 应对文档混沌 处理海量混合格式的文档是首个挑战。最初尝试直接索引全部文件导致内存溢出。解决方案是建立一个文件过滤系统,排除视频、压缩包、模拟文件等非文本内容,并将 PDF、DOCX 等有价值的文档转换为纯文本。这一步将待处理数据量减少了 54%,解决了内存瓶颈。 高效索引与存储 LlamaIndex 默认的 JSON 存储方式无法应对大规模数据,每次重启服务都需重新索引。团队转向使用开源向量数据库 ChromaDB,它支持分批处理和断点续传。这不仅提升了索引效率和稳定性,还将整个索引过程从数小时的CPU处理(在笔记本上)转变为在租用的 NVIDIA RTX 4000 GPU 虚拟机上进行,最终在数周内完成了 73 万个向量的生成。 最终架构与经验 为解决生产环境磁盘空间不足的问题,最终架构将原始文档存储在 Azure Blob Storage 中,仅在用户需要时通过 SAS 令牌生成下载链接。虚拟机本身只需存储 ChromaDB 索引(54GB)、LLM 模型和应用代码。项目经验表明,构建高质量的数据源是 RAG 系统成功的关键,此外,批量处理、错误容忍和状态监控等工程实践也至关重要。 打造个人数字百科全书 项目缘起 一位开发者分享了他将个人生活数据整理成“个人百科全书”的项目。一切始于整理祖母的 1351 张缺乏元数据的老照片。他通过与祖母的交谈记录口述历史,并使用 MediaWiki(维基百科使用的软件)搭建了一个本地维基,将照片和故事整理成结构化的页面。 AI 助力自动化 随着数据量的增加,他开始利用 AI 工具简化流程。他使用语音转文本技术处理访谈录音,并尝试让 Claude Code 等大型语言模型(LLM)根据数字照片的 EXIF 元数据和视觉内容自动生成维基页面草稿。例如,模型能根据一组旅行照片的时间戳和图像,自动识别地点、交通方式,并撰写出详细的旅行记录。 数据融合与洞察 项目的高潮是整合多种数据源。通过结合 Google Maps 时间线、银行交易记录、Uber 行程和 Shazam 听歌历史,AI 代理能够交叉引用信息,推断出用餐的餐厅、观看的球赛队伍,甚至特定场所播放的音乐。这让他发掘了许多被遗忘的生活细节。 开源与愿景 作者将这个名为 whoami.wiki 的项目开源,其核心是 MediaWiki 和一个 LLM 代理。用户可以导出自己的社交媒体、消息记录等数据,由 AI 代理起草页面,再由用户审核和完善。所有数据本地存储,保障隐私。这个过程不仅是对数据的整理,更是对个人历史和人际关系的一次深度回顾。 欧盟议会叫停“聊天监控”法案 事件概述 欧洲议会以一票之差否决了备受争议的“聊天监控”(Chat Control)提案,该提案旨在对私人通信进行大规模自动化扫描以检测儿童性虐待材料。这意味着自 4 月 4 日起,欧盟的临时豁免规定失效,Meta、Google 等科技公司必须停止对欧洲公民私人聊天内容的无差别扫描。 监控的失败 支持者认为法案的停止会造成“法律真空”,但反对者指出,基于司法授权的定点监控依然合法。科学研究和欧盟委员会 2025 年的评估报告均指出现有聊天监控系统的失败:扫描软件不可靠,犯罪分子可轻易规避,而无辜用户则可能被错报;99% 的举报来自 Meta 一家公司,缺乏有效监督;警方收到的数据中近一半与犯罪无关,浪费了调查资源。 驳斥不实信息 法案推动过程中,游说团体散布了多种误导性言论。例如,声称扫描技术“高度精确”,但研究指出其错误率在 13% 到 20% 之间。声称“受害者要求监控”,但事实是幸存者本人正采取法律行动反对这种侵犯隐私的做法。 未来方向 欧洲议会主张未来的儿童保护立法应转向“安全设计”(Security by Design),即通过技术手段从源头上阻止网络诱骗等犯罪行为,并要求服务商和执法部门主动搜索并删除互联网上的非法材料,而非通过大规模监控来应对。 Swift 6.3 发布 核心目标 Swift 6.3 现已发布,旨在将 Swift 语言的应用范围从嵌入式固件扩展到大规模云服务和移动应用。此次更新重点提升了开发者体验和跨平台能力。 关键特性 * 增强 C 互操作性:引入 @c 属性,允许 Swift 函数和枚举直接暴露给 C 代码,便于在现有 C 项目中集成 Swift。 * 解决命名冲突:新的模块名选择器语法 ModuleA::getValue() 可以在导入多个同名 API 的模块时,明确指定调用来源。 * 精细性能控制:为库作者提供了 @specialize、@inline(always) 等新属性,用于更精细地控制编译器优化,平衡性能与代码体积。 * 构建系统统一:Swift Package Manager (SPM) 集成了 Swift Build,为所有平台提供统一的构建引擎,改善跨平台开发体验。 平台扩展 本次发布的重大里程碑是推出了首个官方 Swift SDK for Android。开发者现在可以使用 Swift 开发原生 Android 应用,或通过 Swift Java JNI Core 将 Swift 代码集成到现有的 Kotlin/Java 项目中,为跨平台开发提供了新的选择。 自制能运行《雷神之锤 II》的 FPGA 开发板 硬件设计 开发者 Petr Mikheev 展示了他最新的 DIY 项目:一块能运行《雷神之锤 II》(Quake II)的定制 FPGA 开发板。为实现这一目标,他设计了一块采用 Efinix Ti60F256 FPGA 和 1GB DDR3L 内存的六层 PCB。项目中最大的挑战是首次尝试焊接 BGA 封装的芯片,最终借助底部加热台和热风枪一次成功。 片上系统(SoC)实现 电路板的核心是一个用硬件描述语言(HDL)定义的片上系统。处理器采用基于 RISC-V 架构的 VexiiRiscv 核心,并集成了自研的 DDR3 控制器、视频控制器和 DMA 控制器等多个模块。作者对 VexiiRiscv 和用于生成 HDL 的 SpinalHDL 框架印象深刻,认为它们功能强大,尽管学习曲线较陡。 性能表现 最终,FPGA 资源利用率达到 89%。系统中的 RISC-V 核心运行在 207 MHz,性能测试得分超越了奔腾处理器。SD 卡读取速度为 45 MB/s,DMA 内存填充速度高达 1130 MB/s。由于资源限制,系统未实现完整的 GPU,而是通过扩展 DMA 控制器来执行部分图形操作。项目成功在该硬件上运行了 Doom、Heroes2 等经典游戏。 提升效率的 Shell 技巧 通用技巧 一些命令行技巧适用于几乎所有类 POSIX 环境的 Shell,能极大提升效率。 * 光标与编辑:使用 CTRL+A/E 移动到行首/尾,CTRL+W 删除前一个单词,CTRL+U/K 剪切光标前/后的内容。 * 目录切换:cd - 在当前和上一个目录间快速切换;pushd 和 popd 则通过目录栈管理更复杂的切换。 * 清空文件:> file.txt 可以清空文件内容而不改变文件权限和所有权。 * 脚本安全:在脚本开头使用 set -e(出错时退出)和 set -u(禁止使用未定义变量)可以避免许多意外错误。 Bash & Zsh 特有功能 现代交互式 Shell 提供了更多便捷功能。 * 历史搜索:CTRL+R 可以反向增量搜索历史命令。 * 权限补救:执行命令后发现忘记加 sudo?使用 sudo !! 即可用 sudo 重新执行上一条命令。 * 参数复用:ESC + . (或 ALT + .) 可在光标处插入上一条命令的最后一个参数。 * 批量操作:大括号扩展非常实用,如 cp file.conf{,.bak} 快速备份文件,mkdir -p project/{src,docs,tests} 一次性创建多个目录。 * 递归匹配:启用 globstar 选项后,** 可递归匹配所有子目录,例如 ls **/*.js 能列出所有 JS 文件,比 find 更简洁。 学术界论文勘误困境 核心事件 一篇 2014 年发表于顶级期刊《Management Science》并被引用超 6000 次的论文被指出存在虚假陈述。该论文声称“高可持续性公司在股票和会计表现上均优于同行”,但哥伦比亚大学教授安迪·金发现,其描述的研究方法与实际使用的方法不符。 制度性失灵 尽管论文作者在压力下承认了问题,但他们拒绝提交正式的更正声明。期刊方告知金教授,只有作者才能申请更正。金教授联系了多所大学的研究诚信办公室,均遭遇推诿或拒绝披露调查结果。这暴露了学术界在处理已发表错误时面临的制度性障碍,机构往往选择保护自己人而非追求事实。 社区讨论 Hacker News 社区讨论认为,尽管公开揭露可能无法直接导致撤稿或惩罚,但仍能对作者和机构的声誉产生累积性影响,起到警示作用。有评论建议,可以撰写一篇更广泛的论文,探讨学术勘误过程的困难,或利用《Econ Journal Watch》这类专门进行学术批评的期刊来施加外部压力。这些案例也反映出同行评审机制在发现明显错误时的不足。 深入理解编译器优化 案例一:模数运算 在循环中,(i + 1) % count 这样的模数运算通常会编译成开销较大的除法指令。如果开发者能向编译器保证 i < count,例如通过 C++23 的 [[assume]] 属性,LLVM 的 InstCombine 优化过程就能将其转换为更高效的条件移动指令(cmp 和 cmov),从而避免除法。这表明,向编译器提供更多上下文信息(如通过 assert)有助于生成更优代码。 案例二:字节序转换 在处理二进制数据时,从字节数组加载一个 32 位整数的通用函数(使用循环和位移)可以被现代编译器(如 clang)优化成与手写版本相同的单一 mov 或 mov 加 bswap 指令。这项优化发生在编译后端的指令选择阶段,DAGCombiner 能够识别这种模式并将其合并为单个宽加载指令。 关键启示 要编写高性能代码,理解编译器行为非常重要。 1. 明确意图:使用模板、属性等语言特性,让编译器在编译时获得更多信息。 2. 尽早优化:通过函数内联、强制循环展开等方式,让代码模式更容易在编译流程的早期被识别和优化。 3. 遵循惯例:编写简单、清晰、符合常见模式的代码,因为编译器对这些模式的优化最为成熟。 相关链接: * Personal Encyclopedias * European Parliament decided that Chat Control 1.0 must stop * False claims in a widely-cited paper * Swift 6.3 * My DIY FPGA board can run Quake II * End of "Chat Control": EU parliament stops mass surveillance * Shell Tricks That Make Life Easier (and Save Your Sanity) * The truth that haunts the Ramones: 'They sold more T-shirts than records' * Two studies in compiler optimisations * From zero to a RAG system: successes and failures
260325|Meta儿童安全罚款,告别Sora今日 Hacker News 精选:谷歌发布极致 AI 压缩技术 TurboQuant,数据中心正从交流电转向直流电,一款受 BeOS 启发的桌面 Linux 系统 VitruvianOS 亮相,以及回顾图形界面 GEM 的兴衰史。 谷歌发布 TurboQuant:重塑 AI 效率的极致压缩技术 核心发现 Google Research 推出了一套名为 TurboQuant 的量化算法,用于极致压缩大型语言模型(LLM)和向量搜索引擎。该技术解决了传统向量量化中常见的内存开销问题,能在不损失模型精度的前提下,大幅缩减模型尺寸。 技术原理 TurboQuant 结合了两种算法:PolarQuant 和量化 Johnson-Lindenstrauss (QJL)。PolarQuant 通过将向量数据转换为极坐标,简化数据结构,减少了内存开销。QJL 则处理 PolarQuant 遗留的微小误差,将结果向量压缩成单个符号位,进一步提升了效率和速度。 实验成果 在 Gemma、Mistral 等开源 LLM 上的测试表明,TurboQuant 表现出色。在处理长上下文任务时,它可以将关键值(KV)缓存的内存占用减少至少 6 倍,且不影响模型精度,运行速度甚至比原始 LLM 更快。在 H100 GPU 上,4 比特 TurboQuant 的性能比未量化的 32 比特实现高出 8 倍。这项研究有助于解决大型 AI 模型中的内存瓶颈,并推动语义搜索技术的发展。 “爱迪生的复仇”:数据中心为何转向直流电 AI 时代的功耗挑战 AI 芯片的快速发展给数据中心的基础设施带来了巨大压力。传统数据中心围绕交流电(AC)设计,电力进入后需要经过多次低效的 AC-DC 转换才能供给服务器芯片。对于功耗高达兆瓦级的 AI 机架,这些转换过程中的功率损耗和所需的铜母线尺寸都变得难以接受。 高压直流的优势 为了应对挑战,超大规模数据中心正在从交流电(AC)转向直流电(DC)供电。采用 800V DC 供电方案,可以省去大部分中间转换步骤,直接将高压交流电转换为高压直流电进行分配。这种转变能将铜需求减少 45%,能源效率提高 5%,并为吉瓦级设施降低 30% 的总拥有成本(TCO)。 行业现状与挑战 目前,Vertiv、Eaton 等供应商正积极布局 800V DC 生态。但整个行业仍面临挑战,一个完整的协调生态系统尚未形成,包括电力电子、保护装置和连接器等。美国电气制造商协会(NEMA)指出,许多企业仍在等待更明确的标准和安全框架出现,供应链的建设也依赖于此。 VitruvianOS:一款受 BeOS 启发的桌面 Linux 设计理念 VitruvianOS (V\OS) 是一款开源 Linux 操作系统,其设计灵感源自经典的 BeOS 和 Haiku。它致力于提供快速、响应灵敏且易于使用的体验,强调低延迟和直观的导航。V\OS 秉持 KISS(Keep It Simple, Stupid)原则,不收集用户数据,并力求“开箱即用”,为用户预先优化好各项设置。 核心技术 V\OS 的核心技术是 Nexus Kernel Bridge,一个定制的 Linux 内核子系统。Nexus 将 BeOS 风格的节点监控、设备追踪和消息传递功能引入 Linux 内核。这使得 Haiku 应用程序可以在标准的 Linux 内核上运行,并且只需对 API 进行极小的改动。 未来规划 该系统默认搭载包含实时补丁的 Linux 内核。未来的版本计划引入文件系统索引、实时查询以及支持图形登录的多用户功能。 Meta 因儿童安全问题误导用户被罚 3.75 亿美元 事件概述 新墨西哥州一家法院判决 Meta 公司支付 3.75 亿美元,原因是其在儿童平台安全性问题上误导了用户。陪审团认定,Meta 旗下的 Facebook 和 Instagram 等平台将儿童置于风险之中,使其接触到性露骨内容和性侵犯者,违反了该州的《不公平商业行为法》。 关键证词 在为期七周的审判中,前员工、吹哨人 Arturo Béjar 作证称,他自己的实验表明未成年用户会被推送性化内容。Meta 的内部文件和研究也证实,公司早已知晓其平台上存在儿童性侵者,以及大量用户曾收到不请自来的裸露内容。 Meta 的回应 Meta CEO 马克·扎克伯格表示不认可判决,并计划上诉。公司辩称多年来一直在努力打击不良行为者,并为未成年人提供安全体验,例如推出了青少年账户和家长提醒功能。此次罚款是基于数千项违规行为计算得出的,是美国首个州成功起诉 Meta 并胜诉的儿童安全案件。 图形界面 GEM 往事 PC 平台的挣扎 GEM (Graphics Environment Manager) 是 Digital Research 公司于 1985 年发布的图形用户界面(GUI),比 Windows 1.0 还要早。由于其界面与 Apple Lisa 过于相似,苹果公司以诉讼相威胁,迫使 DRI 修改了 PC 版本的 GEM,使其体验打了折扣。加之在早期 PC 硬件上性能不佳且缺乏应用支持,GEM 未能在 PC 市场取得成功。 在 Atari ST 上的辉煌 GEM 在 Atari ST 平台上取得了巨大成功。Atari ST 配备了更强大的摩托罗拉 68000 CPU,解决了性能问题。作为 ST 的默认环境,GEM 获得了充足的软件支持。许多社区用户回忆起在 ST 上使用桌面出版软件和 MIDI 功能的经历,认为那是一段“温暖的怀旧”时光。 最终的遗产 尽管在主流市场失败,GEM 仍在特定领域找到了生命力,例如作为流行的桌面出版软件 Ventura Publisher 的图形运行时库。1999 年,GEM 的代码以 GPL 许可证开源,催生了 FreeGEM 等后续项目,但开发活动在 2008 年左右基本停止。 GitHub 项目:一次完整的编译器编写之旅 项目定位 “一次编译器编写之旅”是一个 GitHub 项目,详细记录了如何为一个 C 语言子集编写一个自编译(self-compiling)编译器。该项目以实用为导向,循序渐进地讲解编译器开发的各个方面,并辅以必要的理论解释。 内容概览 该项目分为 64 个部分,从基础的词法扫描和解析开始,逐步实现对变量、循环、函数、指针、结构体等 C 语言关键特性的支持。后续内容还涵盖了 C 预处理器、类型转换、常量折叠等优化技术,以及寄存器溢出等高级主题。 项目现状 项目作者 Warren Toomey 表示已停止在该项目上的工作,并开始编写一种名为 alic 的新语言。该项目的代码和脚本采用 GPL3 许可证,非代码文档则遵循知识共享许可。 Algorithm Visualizer:让算法动起来的在线平台 项目简介 Algorithm Visualizer 是一个交互式在线平台,通过可视化的方式帮助用户理解各种算法。它面向学生、教师和专业人士,提供了一种更直观、更具吸引力的学习方式。 核心功能与技术栈 平台的核心功能是支持从用户编写的代码中直接生成可视化效果。它采用的技术栈包括 React、Node.js 和 Redux。整个项目采用模块化结构,由多个代码仓库组成,分别负责算法可视化内容、不同语言的可视化库以及后端服务。 Flighty Airports:实时追踪全球机场动态 平台功能 Flighty Airports 是一个提供全球机场实时信息的平台。用户可以通过搜索或快捷键快速查找任一机场的信息,包括其唯一的 IATA 三字代码。平台还提供“TV 模式”用于信息展示,并可通过其 App 实现实时航班追踪。 实时干扰监控 该平台的一大亮点是“主要机场与干扰”板块,实时展示北美各大机场的运营状况。它详细列出了每个机场出发和抵达航班的平均延误时间、准点率和取消率,并高亮显示如“地面延误”或“高取消率”等严重警报,帮助旅客及时了解行程变化。 相关链接: * Flighty Airports * Goodbye to Sora * VitruvianOS – Desktop Linux Inspired by the BeOS * TurboQuant: Redefining AI efficiency with extreme compression * In Edison’s Revenge, Data Centers Are Transitioning From AC to DC * Meta told to pay $375M for misleading users over child safety * What happened to GEM? * A Compiler Writing Journey * An Aural Companion for Decades, CBS News Radio Crackles to a Close * Algorithm Visualizer
260323|香烟打火机Root,情感垃圾邮件今日 Hacker News 精选:用点火器获取 root 权限的硬件攻击,Transformer 内部电路的直观解析,以及美国运通两次零停机迁移支付网络的工程实践。 用点火器就能获取 root 权限? 攻击原理:电磁故障注入 研究人员展示了如何通过一个改装的压电式点火器,对 DDR3 内存进行电磁故障注入(EMFI),在 Linux 系统上实现本地权限提升。这种攻击利用点火器产生的电磁干扰,在内存数据线上诱导位翻转(bit-flip),从而破坏关键数据结构。虽然攻击在时间控制上精度不高,但在特定数据位上能实现一致的翻转效果,是一种低成本的硬件攻击方式。 从沙箱逃逸到权限提升 攻击首先在 Python 环境中得到验证。通过在内存中伪造一个 bytearray 对象,并利用位翻转修改指向 bytes 对象的指针,攻击者成功获得了任意内存读写的能力,实现了沙箱逃逸。为了确保攻击命中 DRAM 而非 CPU 缓存,研究者通过循环访问大量数据,强制系统从主内存读取。 攻击步骤详解 随后,该技术被用于攻击 Linux 内核以获取 root 权限。攻击者首先通过“页表喷射”,用大量可控的零级页表填充物理内存。接着,在循环访问内存时触发点火器,诱导页表条目(PTE)发生位翻转。这使得一个本应指向普通内存页的 PTE,错误地指向了另一个页表,从而让攻击者获得了修改页表的权限。拥有此权限后,攻击者可以映射任意物理内存,找到并修改 /usr/bin/su 程序在页缓存中的内容,将其替换为获取 root shell 的代码,最终完成提权。 Transformer 内部电路的直观理解 核心隐喻:残差流即内存 要直观理解 Transformer 的工作原理,可以将其核心组件“残差流”(residual stream)想象成一块共享内存(DRAM)。模型中的不同部分,如注意力头和 MLP,在每一层按顺序从这块“内存”中读取和写入信息。模型通过学习,将这个高维向量空间划分为不同的子空间,以避免不同组件写入的信息相互覆盖。 信息通路:QK 与 OV 电路 注意力机制负责决定从哪些词元(token)位置读取信息。其内部可分为 QK 电路和 OV 电路。QK 电路通过查询(Query)和键(Key)矩阵的计算,决定注意力应该集中在哪些源词元上,生成一个注意力模式。OV 电路则根据这个模式,通过值(Value)和输出(Output)矩阵,从被选中的源词元残差流中读取信息,并将其写入目标词元的残差流。这两个电路共同构成了信息在模型内部流动的基本路径。 涌现能力:归纳头的形成 简单的电路可以组合成更复杂的结构,实现高级功能。例如,“归纳头”(Induction Heads)是模型学习重复模式(如 A B ... A __,预测 B)的关键。它通常由两层注意力头组合而成:第一层的一个头负责将前一个词元的信息写入特定子空间,第二层的一个归纳头则利用这个信息来定位序列中更早出现的模式,并将正确的下一个词元信息写入残差流,从而完成预测。这种组合能力使得 Transformer 能够从简单的信息移动中学习复杂的序列规律。 美国运通如何两次零停机迁移支付网络 两次大规模迁移 美国运通对其任务关键型支付网络成功实施了两次零停机迁移。第一次是将系统从旧有平台迁移到新的微服务架构。第二次是将新的支付平台从旧的 Kubernetes 基础设施迁移到全新环境中。两次迁移都要求在不中断实时支付处理的前提下完成。 关键策略:金丝雀路由与影子流量 成功的核心在于对流量的精细控制。团队首先引入一个全局交易路由器(GTR)来统一管理所有流量。在迁移过程中,他们使用了两种关键策略: 1. 影子流量(Shadow Traffic):将实时生产流量复制一份,发送到新平台进行处理。这可以在不影响用户的情况下,验证新旧系统在功能和性能上的差异。 2. 金丝雀路由(Canary Routing):将一小部分(例如 1%)的实时流量路由到新平台,密切监控各项指标。确认稳定后,逐步增加流量比例,直到所有流量都切换到新平台。如果出现任何问题,可以立即将流量切回旧系统。 工程实践总结 两次成功的迁移为大规模系统改造提供了宝贵经验。流量控制能力是前提,快速、安全的回滚方案是底线。同时,对系统健康、性能和业务指标的深入可观察性(Observability)至关重要。基础设施即代码(Infrastructure-as-code)则保证了新环境的一致性和可重复性。 反向工程揭示 TiinyAI 口袋电脑的真相 宣传与现实的差距 TiinyAI 公司宣传其 Pocket Lab 是一款“口袋 AI 超级计算机”,号称能以 20 tokens/s 的速度运行 120B 参数模型。然而,通过对其营销照片和公开资料的分析发现,其宣传存在系统性误导。所谓的“120B”模型实际上是混合专家(MoE)模型,每次推理仅激活约 5.1B 参数,计算负载远小于宣传给人的印象。 核心设计缺陷 该设备的核心问题在于其内存架构。它并非宣传的 80GB 统一内存,而是由 SoC 的 32GB 内存和独立 NPU 的 48GB 内存组成。两者通过相对较慢的 PCIe 链路连接,带宽成为严重瓶颈。当模型需要跨越两个内存池时,性能会急剧下降。基准测试显示,在处理 64K 长上下文时,其生成首个 token 的时间(TTFT)长达 28 分钟,使其在代码辅助等实际应用场景中几乎不可用。 透明度疑点 分析还指出,TiinyAI 声称的“专有优化技术”实际上是上海交通大学的开源学术项目。公司的背景信息模糊,领导团队不明确,其运作模式也与其“美国 AI 初创公司”的定位不符。低至 1 万美元的 Kickstarter 募资目标更像是一种营销策略,而非严肃的硬件研发项目。 PostgreSQL 命令行中断查询的“奇技淫巧” 一个未加密的取消请求 在 psql 命令行工具中按 Ctrl-C 取消查询,其实现方式存在安全隐患。psql 客户端会与服务器建立一个全新的连接,发送一个特殊的 CancelRequest 消息。问题在于,这个取消请求总是以未加密的明文形式发送,即使主连接配置了最严格的 TLS 加密。 安全风险:拒绝服务 这种设计带来了潜在的拒绝服务(DoS)攻击风险。由于取消请求未加密,在公共网络中可能被攻击者嗅探和重放。攻击者可以不断重放该请求,导致目标用户后续的所有查询都被立即取消。此外,由于取消是基于连接而非特定查询,还可能存在竞态条件,导致错误的查询被取消。 对中间件的影响 未加密的取消请求也给网络代理和监控工具带来了麻烦。许多依赖 TLS SNI(服务器名称指示)来路由流量的中间件,无法正确处理这种不包含 SNI 信息的明文请求,导致取消功能失效。像 Neon 这样的平台不得不开发变通方案,通过缓存连接信息来正确转发这些特殊的取消请求。 POSSE:夺回你的内容主权 什么是 POSSE POSSE(Publish on your Own Site, Syndicate Elsewhere)是一种内容发布策略,意为“先在自己的网站发布,再分发到其他平台”。它的核心理念是,将个人网站作为所有内容的权威来源和永久归宿,而将社交媒体平台(如 Twitter、Facebook)视为内容的“分发渠道”。发布到社交媒体的副本应链接回个人网站上的原始文章。 为何选择 POSSE 这种做法让创作者可以完全掌控自己的内容,不受制于任何第三方平台的规则或算法变化。即使某个社交平台关闭,原始内容依然安全地保存在个人网站上。同时,将规范 URL(canonical URL)保留在自己的域名下,有利于搜索引擎优化。Hacker News 社区的讨论认为,POSSE 的重点不仅是技术架构,更是为了维护人际关系,让朋友们可以在他们习惯的平台上看到你的内容,同时将流量引导回你的“主场”。 实现与对比 实现 POSSE 可以借助 Bridgy 等自动化服务,或者为 WordPress 等平台安装插件。它与 PESOS(Publish Elsewhere, Syndicate to Own Site,先在别处发布,再同步回自己网站)策略正好相反。POSSE 保证了内容的原创性和所有权,而 PESOS 则可能导致所有权模糊。 个人数字服务迁移欧盟实践指南 迁移动机:寻求数据保护 出于对数据保护的重视,一位开发者分享了将其所有数字服务从非欧盟国家迁移至欧盟服务商的经验。目标是利用欧盟相对更严格和用户友好的数据保护法律,如 GDPR。 替代服务清单 * 邮件服务:从 Fastmail 迁移至德国提供商 Uberspace。Uberspace 提供灵活的 Shell 账户,支持无限域名和任意发件地址,采用“按需付费”模式。 * 日历与联系人:在 Uberspace 上自行部署 NextCloud,以使用其内置的 CalDAV 和 CardDAV 功能,替代了原有的日历服务。 * 域名与 DNS:从 Namecheap 迁移至德国的 hosting.de,看重其价格、评价和本地化支持。 * 代码托管:将所有 Git 仓库从 GitHub 迁移至德国的非营利组织 Codeberg.org,这是一个注重开源和隐私的选择。 * VPN:继续使用瑞典的 Mullvad,其强大的隐私政策和匿名账户系统备受推崇。 移动设备的选择 为了摆脱对 Google 的依赖,作者为手机刷入了注重隐私和安全的操作系统 GrapheneOS,并尝试使用运行轻量级 Linux 的旧 MacBook Air 来替代 Chromebook。 Tin Can:一款为孩子设计的复古“座机” 一款儿童专用“座机” Tin Can 是一款专为儿童设计的 WiFi 电话,外观和功能模仿老式座机。它的目标客户是那些希望延迟孩子使用智能手机,但又希望孩子能与朋友保持联系的父母。设备通过家庭 WiFi 运行,不具备浏览器、应用商店或社交媒体功能。 功能与定位 父母可以通过配套应用设置一份经批准的联系人列表,孩子只能与列表中的人通话。父母还可以设定通话时间限制。Tin Can 的创始人表示,产品的初衷是为孩子创造一个结构上减少焦虑的世界,让他们能独立地安排社交活动,而无需父母充当“社交秘书”。 市场反响 这款产品迎合了当前推迟孩子接触智能手机的社会趋势。自 2025 年初推出以来,Tin Can 已售出数万部,目前订单已排至年底。它填补了智能手表和功能受限的儿童手机之外的市场空白,提供了一种简单、安全的通讯方式。 垃圾邮件也开始讲究“氛围感”了 AI 驱动的“氛围诈骗” 垃圾邮件正变得越来越精美,其设计和排版甚至优于许多合法的营销邮件。这种现象被称为“vibe-coding”,即利用 AI 工具或无代码平台,根据审美“氛围”而非专业知识来生成设计和代码。这使得垃圾邮件在视觉上更具欺骗性。 低门槛的威胁 AI 工具极大地降低了网络犯罪的门槛。现在,不具备编程技能的人也能轻松生成以假乱真的网络钓鱼邮件,甚至构建“无代码”勒索软件。这种趋势被称为“VibeScamming”,即利用 AI 创建具有诱惑力的诈骗方案。 如何识别 尽管视觉效果提升,这些垃圾邮件仍有迹可循。它们通常使用邮箱地址而非收件人姓名来称呼对方,发件地址也常常经过混淆。此外,一些技术上的疏忽,例如使用裸露的 Firebase 域名发送邮件,也可能暴露其身份。用户应使用邮件别名等方法来追踪信息泄露源头,并保持警惕。 FIRST 与乐高教育结束近 30 年合作 长期合作即将终止 致力于推动 STEM 教育的非营利组织 FIRST 宣布,其与乐高教育长达近三十年的合作关系即将结束。双方合作的 FIRST 乐高联赛(FLL)项目曾为全球数百万青少年提供了宝贵的动手实践和团队协作经验。乐高教育决定不再续签合作协议,2026-2027 赛季将是 FLL 的最后一个赛季。 FIRST 的未来计划 尽管合作终止,FIRST 承诺将继续为社区提供高质量的体验,并已开始着手开发面向 K-8 年级(学前班至八年级)的下一代项目。新项目将延续 FIRST 的核心价值观,旨在激发学生的创造力、协作能力和 STEM 探索精神。 相关链接: * POSSE – Publish on your Own Site, Syndicate Elsewhere * Tin Can, a 'landline' for kids * Intuitions for Tranformer Circuits * Can you get root with only a cigarette lighter? (2024) * Migrating to the EU * Migrating the American express payment network, twice * I Reverse-Engineered the TiinyAI Pocket Lab from Marketing Photos * The way CTRL-C in Postgres CLI cancels queries is incredibly hack-y * They’re vibe-coding spam now * First and Lego Education Partnership Update
260322|笔记本运行巨型AI模型,Cloudflare标记archive.today今日 Hacker News 精选:在笔记本电脑上运行 3970 亿参数模型,探讨 JavaScript 依赖膨胀的根源,并看 AI 如何分析长达 25 年的购物收据。 Flash-MoE:在笔记本上运行 3970 亿参数模型 MacBook 上的 397B 模型 Flash-MoE 项目成功在一台配备 48GB 统一内存的 Apple M3 Max 芯片的 MacBook Pro 上,运行了 3970 亿参数的 Qwen3.5 混合专家模型 (Mixture-of-Experts, MoE)。该模型以每秒超过 4.4 个 token 的速度生成高质量文本,并支持工具调用功能。 整个实现不依赖 Python 或任何主流框架,仅使用 C、Objective-C 和手写的 Metal 着色器。模型权重总计 209GB,通过定制的计算管线直接从 SSD 流式加载到内存中。 核心技术:流式加载与手写着色器 项目成功的关键在于多项底层优化。首先,模型庞大的专家权重按需从 NVMe SSD 读取,每一层只加载当前计算所需的 4 个活跃专家。项目并未设计复杂的缓存机制,而是完全依赖操作系统的页面缓存,实现了约 71% 的缓存命中率。 其次,所有关键计算,如矩阵向量乘法、激活函数和注意力机制,都由手写的 Metal 计算着色器在 GPU 上执行。通过将 CPU 准备数据和 GPU 计算两个环节重叠执行,进一步提升了效率。 硬件限制与优化取舍 开发过程发现,在 Apple Silicon 的统一内存架构下,SSD 的直接内存访问 (DMA) 与 GPU 计算无法有效并行。由于 GPU 内核已达到内存带宽瓶颈,任何后台的 SSD 读写都会通过内存控制器竞争,显著增加 GPU 计算延迟。因此,串行执行(GPU 计算 → SSD 读取 → GPU 计算)成为最佳方案。 项目还尝试了多种未能奏效的优化,包括 LZ4 专家压缩、I/O 预取和异步 I/O 接口,这些方案的开销都超过了其带来的收益。 JavaScript 依赖膨胀的三大支柱 为旧环境兼容买单 许多 npm 包为了支持非常陈旧的 JavaScript 运行时(如对应 IE6 的 ES3),内置了大量现代平台已原生提供的功能代码。例如,使用 is-string 包而非 typeof 检查,或 hasown 包而非 Object.hasOwn。 对于绝大多数使用现代浏览器或 Node.js 的开发者而言,这些兼容代码是完全不必要的。有社区成员指出,虽然大部分人不需要,但在某些企业或嵌入式系统中,旧版本支持仍是关键需求,直接移除可能导致生态分裂。 原子化架构的代价 原子化架构主张将功能拆解成极小的、可复用的包。理论上,这能促进代码复用,但实践中带来了新问题。许多这类“原子”包仅被同一个维护者的另一个包使用,效果等同于内联代码,却增加了 npm 请求、文件解压和供应链攻击的风险。 此外,这种架构容易导致依赖树中出现同一模块的多个不同版本,增加了最终打包体积。社区有观点认为,问题不在于原子化思想本身,而在于当前工具链在版本解析和摇树优化 (tree-shaking) 方面支持不足。 过期的“Ponyfill” Ponyfill 是一种不污染全局环境的 Polyfill,供库开发者安全地使用未来功能。问题在于,当某项功能已被所有主流环境支持后,对应的 Ponyfill 往往没有被及时移除。例如,用于提供 Object.entries 等功能的 Ponyfill 每周仍有数百万次下载,增加了不必要的代码。 解决方案与工具 文章作者认为,JS 生态的大多数用户在为少数人的向后兼容需求付出代价。维护者和使用者应共同审视依赖,移除不必要的包。社区也提供了一些工具来应对依赖膨胀,例如 knip 用于发现死代码,npmgraph 用于可视化依赖树,以及 module-replacements 项目提供了可被原生功能替代的包列表。 AI 分析我 25 年的购物收据 一个长达 25 年的数据项目 一位技术爱好者自 2001 年以来,扫描并保存了所有消费收据,共计 11,345 张。最近,他利用 AI 编码代理,耗时 14 天,分析了这些收据,目标是追踪 25 年来鸡蛋的价格。 整个项目作者的实际键盘操作时间约 15 小时,主要负责下达指令,AI 代理则执行了大部分编码和数据处理工作。项目共消耗 16 亿 token,最终找到了 589 张包含鸡蛋信息的收据。 AI 工具栈解决现实难题 项目遇到了多种真实世界的数据难题。对于混杂在白色背景上的多张收据,传统计算机视觉方法均告失败,最终通过 Meta 的 SAM3 模型一次调用就成功分割。对于方向不一的扫描件,直接将图像喂给大型语言模型(LLM)进行 OCR,效果远超 Tesseract 等传统工具。 项目中期,作者引入了可在本地 GPU 运行的 PaddleOCR-VL 模型,大幅提升了 OCR 的准确性和效率。当需要从文本中提取结构化数据时,正则表达式暴露出大量漏报,而 LLM 则能更准确地识别缩写和 OCR 错误。 人机协作的成果与成本 项目展示了人与 AI 协作的强大能力。作者负责发现问题和制定策略,AI 代理则负责实现、修复和大规模应用。例如,当发现一个隐藏在 OCR 噪声中的商店地址后,作者向代理展示了模式,代理便成功恢复了 40 张缺失位置信息的收据。 最终数据显示,项目总花费约 1,591 美元,成功记录了 8,604 个鸡蛋的购买信息,总花费 1,972 美元。作者认为,项目的成功依赖于专业模型的组合:SAM3 负责图像分割,PaddleOCR 负责文本提取,而 Codex 和 Claude 等通用 LLM 负责其余所有工作。 我的第一个 Linux 内核补丁 自制 Hypervisor 引发系统崩溃 一位开发者在构建一个类似 KVM 的 Type-2 hypervisor 时,发现程序在多核物理机上运行时,系统会频繁崩溃。但在虚拟机环境下或绑定到单个核心时,程序运行正常。 日志显示,一个核心在处理不可屏蔽中断 (NMI) 时发生页面错误,导致该核心瘫痪。随后,其他核心因无法与该核心通信而陷入死锁,最终拖垮整个系统。 追溯 x86 任务状态段 问题的根源在于 hypervisor 需要正确管理宿主机 (host) 和客户机 (guest) 的 CPU 状态。其中,x86 架构的任务状态段 (Task State Segment, TSS) 地址必须被准确写入虚拟机的控制结构 (VMCS) 中。 作者最初从 KVM 测试代码中借鉴了一段函数来获取 TSS 地址。经过排查,他发现这段代码在多核环境下会计算出错误的地址,导致 CPU 无法找到正确的内核栈,从而引发崩溃。 C 语言的符号扩展陷阱 罪魁祸首是 C 语言中的一个符号扩展 (sign-extension) bug。该函数在拼接 TSS 地址的多个部分时,一个 uint8_t 类型的变量在位移操作中被自动提升为有符号的 int。如果该变量的最高位是 1,它就会被当作负数处理,在后续转换为 uint64_t 时,高 32 位被错误地填充为 1,从而破坏了最终的地址。 解决方案很简单,只需在位移操作前将所有变量显式转换为 uint64_t。作者提交的补丁已被合并到 Linux 内核中。 Floci:免费开源的本地 AWS 模拟器 LocalStack 社区版的替代品 Floci 是一个免费、开源的本地 AWS 模拟器。它的出现是为了替代 LocalStack 社区版,后者将在 2026 年要求认证令牌,并停止对 CI/CD 和安全更新的支持。Floci 承诺永久免费,无认证要求,并提供持续的 CI/CD 支持和安全更新。 轻量、高性能与功能完备 Floci 启动时间约 24 毫秒,空闲内存占用约 13 MiB,Docker 镜像大小仅 90 MB。它支持超过 20 种 AWS 服务,并通过了全部 408 项 SDK 测试。 与 LocalStack 社区版相比,Floci 在 API Gateway v2、Cognito、ElastiCache 和 RDS 等服务上提供了更全面的支持。 快速上手与配置 用户可以通过 docker compose up 命令快速启动 Floci。它与现有的 AWS SDK 无缝集成,只需将端点 URL 指向本地地址即可。所有配置项均可通过环境变量进行设置,支持多种数据存储模式。 Tooscut:浏览器内的专业视频编辑器 基于 WebGPU 与 WASM Tooscut Editor 是一款直接在浏览器中运行的专业级非线性视频编辑器,无需安装。它利用 WebGPU 和 Rust/WASM 技术,旨在提供与原生应用相媲美的性能。 专业级编辑功能 该编辑器支持多轨时间线、关键帧动画和实时效果预览。所有渲染和效果计算都通过 GPU 加速,用户可以对变换、不透明度、色彩、模糊等属性添加贝塞尔曲线动画。 本地处理与隐私 Tooscut 利用 File System Access API,所有媒体文件都保留在用户本地,不会上传到云端,确保了数据的隐私和安全。 卧式冰箱:一种更节能的设计 利用冷空气下沉原理 传统立式冰箱在开门时,密度较大的冷空气会自然流出,导致能量损失。卧式冰箱 (chest fridge) 采用顶部开门设计,能有效将冷空气保留在箱内,大幅提升能源效率。 显著的节能效果 作者分享,一台由冰柜改装的卧式冰箱每天仅消耗约 0.1 kWh 电量,一年电费不到 5 美元。除了节能,恒定的低温环境也让食物保鲜效果更好。 现代变频技术的优势 现代变频冰柜可以直接设置为冰箱温度,无需改装。此外,它们采用慢启动技术,启动时的峰值功率远低于传统压缩机,对小型的离网供电系统非常友好。 Cloudflare 将 archive.today 标记为恶意域名 Cloudflare 已将网页存档服务 archive.today 标记为“命令与控制/僵尸网络”(C&C/Botnet) 域名。因此,Cloudflare 的公共 DNS 解析器 1.1.1.2(一个会拦截恶意软件的版本)已不再解析该域名。使用该 DNS 服务的用户将无法访问 archive.today。 Boomloom:用双手思考的织布机 直观的织物结构设计 Boomloom 是一款设计独特的织布机,旨在简化编织过程。它通过 5 根特殊设计的横杆,让用户无需解读复杂的图纸,即可直观地转动横杆来构建类似四综织布机的复杂图案。 易于上手与携带 这款织布机体积小巧,开箱即用,设置简单。它既适合初学者探索编织,也适合经验丰富的编织者用来打样和实验。其轻巧、可堆叠的设计适用于家庭、工作室和教室等多种场景。 霍尔木兹扫雷:你是否厌倦了胜利? 这是一个经典扫雷游戏的变体。游戏规则与传统扫雷基本一致:左键点击揭开方块,右键点击标记旗帜。它的特殊规则是“地雷只会生成在水域中”。游戏以“你是否厌倦了胜利?”作为宣传语,为经典玩法增添了一丝趣味。 相关链接: * The three pillars of JavaScript bloat * Professional video editing, right in the browser with WebGPU and WASM * Chest Fridge (2009) * Boomloom: Think with your hands * Floci – A free, open-source local AWS emulator * Cloudflare flags archive.today as "C&C/Botnet"; no longer resolves via 1.1.1.2 * Hormuz Minesweeper – Are you tired of winning? * Flash-MoE: Running a 397B Parameter Model on a Laptop * My first patch to the Linux kernel * 25 Years of Eggs
260321|AI训练,网络历史,Rust WASM 解析器提速Hacker News 今日精选:从 Rust 与 TypeScript 的性能反转,到 Mamba-3 AI 模型对推理效率的革新,我们探讨了软件开发中的速度与沉淀,以及 AI 时代下网络档案的存续危机。 Rust WASM 解析器改用 TypeScript 后,速度反而变快了 意外的性能瓶颈 Thesys Engineering 团队在将其 openui-lang 解析器从 Rust 编译的 WebAssembly (WASM) 迁移到原生 TypeScript 后,发现性能得到显著提升。单次调用速度加快了 2.2 到 4.6 倍,总处理成本降低了 2.6 到 3.3 倍。这个结果颠覆了团队最初认为 Rust 和 WASM 在浏览器端应有性能优势的假设。 该解析器用于将大语言模型 (LLM) 生成的流式文本转换为 React 组件树,对延迟要求极高。 WASM 的“边界税” 性能问题的根源不在于 Rust 代码本身的执行速度,而在于 JavaScript (JS) 与 WASM 之间的“边界开销”。每次调用都涉及多次数据复制和转换:JS 字符串复制到 WASM 内存,Rust 解析后序列化为 JSON 字符串,再将 JSON 字符串复制回 JS 内存,最后由 JS 引擎解析。 团队曾尝试使用 serde-wasm-bindgen 直接传递对象以避免 JSON 序列化,但性能反而下降了 30%。原因是 JS 运行时无法直接读取 Rust 的内存布局,该库在底层需要进行大量细粒度的边界调用来转换数据,其开销比一次性传输和解析 JSON 字符串更高。 算法优化的更大价值 将整个解析器移植到 TypeScript,完全在 V8 引擎的内存中运行,消除了边界开销,带来了第一轮性能提升。但团队发现,更深层的问题在于算法。原始实现每次收到新的数据块时,都会重新解析累积的全部内容,导致 O(N²) 的时间复杂度。 最终的解决方案是引入语句级增量缓存。解析器只重新解析当前未完成的语句,将算法复杂度降至 O(N),这比语言层面的迁移带来了更大的性能收益。这个案例表明,在进行技术选型前,应准确分析瓶颈所在,并且算法优化通常比底层语言或技术的选择影响更大。 Mamba-3:为高效推理而生的新一代状态空间模型 核心目标:优化推理 Together AI、卡内基梅隆大学和普林斯顿大学的研究人员发布了 Mamba-3,这是一款新型的状态空间模型 (SSM),其设计重点从 Mamba-2 的训练速度转向了推理效率。随着行业重心从模型预训练转向部署和应用,推理成本和延迟成为关键瓶颈。 Mamba-3 通过采用更具表现力的递归公式、支持复数值状态以及引入多输入多输出 (MIMO) 变体,在不显著增加解码延迟的前提下提升了模型准确性。 架构关键变化 Mamba-3 引入了多项架构改进以提升性能和稳定性。新增的 QKNorm 归一化层增强了训练稳定性。通过新的递归机制,模型移除了 Mamba-1/2 中常见的短因果卷积。 此外,模型引入了旋转位置嵌入 (RoPE) 来实现复数值 SSM,并使用 MIMO 投影扩展了模型的表示能力。整体架构也调整为交错的多层感知器 (MLP) 层,与主流 Transformer 模型保持一致。 性能表现与内核实现 基准测试显示,在 1.5B 模型规模下,Mamba-3 在所有序列长度的预填充和解码延迟方面,均优于 Llama-3.2-1B、Gated DeltaNet 和 Mamba-2。 为了在硬件上实现最佳性能,团队使用了 Triton、TileLang 和 CuTe DSL 等多种工具构建了高度优化的 GPU 内核。这些实现充分利用了 Mamba-3 算法设计简洁的优势,在不同层次的 GPU 抽象上实现了性能最大化。 有些事,只能交给时间 软件开发的速度崇拜 当前软件和创业文化普遍痴迷于速度,强调快速迭代和迅速部署。然而,许多真正有价值的事物本质上需要时间沉淀,比如一棵大树的成长,或是一个品牌的信誉。 这种对时间的尊重体现在人们对瑞士手表或老旧房产的偏爱上,它们因制造时间或年代久远而价值不菲。 “摩擦”的必要性 文章认为,在开发流程中,并非所有“摩擦”都是坏事。以 SOC2 合规性为例,虽然业界热衷于用工具消除其带来的流程阻碍,但这些流程本身提供了思考、完善和建立信任的必要时间,如同重要决策前的“冷静期”。 一味追求速度,反而可能产生有害的结果。 AI 加速的隐忧 AI 代码生成能力进一步加剧了对速度的推崇,鼓励开发者跳过代码审查、设计等关键环节。作者担忧,这种急功近利的心态正在缩短软件的“保质期”,并破坏与客户建立信任所需的基础。 许多短命的初创公司和开源项目都反映了这种缺乏长期承诺的现状。文章最后用树木作比喻,强调信任、质量和社区无法通过一次周末冲刺完成,它们需要多年的投入和承诺。 为防 AI 封禁互联网档案库,将抹去网络历史 出版商阻止网页存档 多家新闻出版商正在采取技术措施,阻止互联网档案 (Internet Archive, IA) 的网络爬虫抓取其网站内容。此举旨在防止 AI 公司在未经许可的情况下,使用其受版权保护的材料来训练大语言模型。 出版商已对部分 AI 公司提起诉讼,寻求对其作品使用方式的控制权。 档案库与 AI 公司的区别 电子前沿基金会 (EFF) 指出,阻止像 IA 这样的非营利性档案机构是一个错误的回应。IA 的使命是保存网络历史,其行为与传统图书馆保存报纸的性质相同,旨在为未来提供可信赖的在线出版记录。 IA 的“回溯机器” (Wayback Machine) 保存的网页,常常是查看文章历史版本或已删除内容的唯一可靠来源,对记者、研究人员和公众至关重要。 存档与搜索的合法性 EFF 强调,存档和搜索是受“合理使用” (fair use) 原则保护的合法行为。法院曾裁定,谷歌为建立可搜索数据库而复制整本书籍的行为具有“变革性目的”,因此属于合理使用。IA 的运作遵循相同原则。 即使未来法院对 AI 训练施加限制,保护网络存档的法律原则也已明确。为了应对 AI 版权争议而牺牲公共历史记录,将是一个深远且不可逆转的错误。 FFmpeg 入门指南(2024) 核心组件 FFmpeg 是一套用于处理多媒体文件、流和设备的工具与库。其核心库包括: * libavformat:负责输入输出和流的封装/解封装 (muxing/demuxing)。 * libavcodec:处理媒体数据的编码和解码。 * libavfilter:提供基于图的滤镜功能。 * libswscale:用于颜色转换和图像缩放。 * libswresample:处理音频重采样和格式转换。 媒体处理流程 构建一个简单的多媒体播放器,基本流程是将输入文件解封装成独立的音频和视频流,然后将这些流解码成可供渲染的原始数据。 具体步骤包括:分配并打开格式上下文 (AVFormatContext),分析流信息,为特定流查找并初始化解码器 (AVCodecContext),然后在一个循环中读取编码数据包 (AVPacket) 并将其发送给解码器,最后从解码器接收解码后的原始帧 (AVFrame)。 关键数据结构 理解 FFmpeg 的核心在于掌握其关键数据结构: * AVFormatContext:代表整个多媒体文件或流的容器。 * AVStream:代表文件中的一个单独的流(如一个视频轨或一个音频轨)。 * AVPacket:包含来自流的编码数据块。 * AVFrame:包含解码后的数据,如一个原始视频帧或一段音频样本。 Ghostling:一个极简的可嵌入终端项目 项目定位 Ghostling 是一个演示项目,展示了如何基于 libghostty C API 构建一个功能最小化的终端。它并非一个功能齐全的日常工具,而是 libghostty 库的一个最小可行应用示例。 该项目使用 Raylib 库进行窗口管理和 2D 渲染,以突显 libghostty 的灵活性和独立性。 核心能力:libghostty libghostty 是从 Ghostty 终端核心中提取的可嵌入库,提供 C 和 Zig API。它是一个零依赖库,负责处理 VT 序列解析、终端状态管理和渲染器状态管理,但不包含任何具体的渲染或窗口代码。 它继承了 Ghostty 在精确仿真、SIMD 优化解析、Unicode 支持和内存使用方面的所有优势。 功能与使用 尽管 Ghostling 本身很小,但它继承了 libghostty 的丰富功能,包括支持文本重排的窗口大小调整、24 位真彩色、多种文本样式、鼠标追踪和 Kitty 键盘协议。 标签页、分屏、会话管理等高级 GUI 功能需要由上层应用自行实现。项目选择 C API 是为了保证最广泛的语言兼容性,鼓励社区为其创建不同语言的绑定。 相关链接: * Some Things Just Take Time * We rewrote our Rust WASM parser in TypeScript and it got faster * Ghostling * The worst volume control UI in the world (2017) * Linux Applications Programming by Example: The Fundamental APIs (2nd Edition) * Molly guard in reverse * Blocking Internet Archive Won't Stop AI, but Will Erase Web's Historical Record * Mamba-3 * FFmpeg 101 (2024) * Lent and Lisp
260319|Astral加入OpenAI,康威生命游戏现实版Hacker News 今日精选:Python 工具链 Astral 加入 OpenAI,研究人员通过复制模型层级提升大模型推理能力,我们还将探讨详细规格与代码的界限,以及增加住房供给如何有效降低城市租金。 Astral 宣布加入 OpenAI 提升 Python 开发体验 Astral 公司由 Charlie Marsh 创立,致力于通过开发快速、稳定的 Python 工具来提升编程效率。其产品 Ruff(代码检查器)、uv(包安装器)和 ty(类型检查器)已成为现代 Python 开发的基础,每月下载量达数亿次。 与 Codex 团队合作 Astral 团队将加入 OpenAI 旗下的 Codex 团队,该团队专注于将自然语言转化为代码的 AI 模型。创始人 Charlie Marsh 认为,AI 正在迅速改变软件开发,与 Codex 合作是实现“让编程更高效”这一目标的最佳途径。 开源工具的未来 Astral 承诺,加入 OpenAI 后将继续支持和开发其现有的开源工具。团队将继续在开源社区中与用户共同构建产品,并探索如何将这些工具与 Codex 模型无缝结合。 无需训练,通过复制层级提升大模型逻辑推理能力 核心发现 一个名为“llm-circuit-finder”的项目发现,通过在推理时复制大型语言模型(LLM)中的特定层,可以显著提升其逻辑推理能力,而无需任何额外的训练或权重修改。例如,通过复制 Devstral-Small-2-24B 模型中的第 12-14 层,其在 BBH 逻辑推导基准测试上的表现从 0.22 提升至 0.76,增幅达 245%。 “功能电路”理论 该方法基于一个核心思想:Transformer 模型在训练中会形成“功能电路”,即由多个层级组成的、作为一个整体运作的认知单元。通过重复正确的层级模块,相当于让模型的隐藏状态再次通过其推理管线,从而增强了推理深度。这些电路的位置非常精确,移动一层就可能导致效果消失。 实际应用考量 复制层级会增加 VRAM 的使用量,并相应地减慢推理速度。在一个 40 层的模型中增加三层,会导致约 7.5% 的速度下降。该方法与模型微调(fine-tuning)是正交的,两者可以结合使用以获得更好的效果。项目工具已开源,可在消费级 GPU 上快速寻找和验证最佳的层复制配置。 AI 代理自主研究 MaxSAT 问题并取得突破 项目定位 开源项目 agent-sat 让一个自主 AI 代理学习成为最大可满足性问题(MaxSAT)领域的专家。该代理在没有人类指导的情况下,通过自我研究和迭代,为 2024 年 MaxSAT 评估中的 229 个实例寻找更优的解决方案。 自主发现的策略 代理通过实验,自主发现并开发了多种高级求解技术。这些技术包括带选择变量的贪婪 SAT、核引导搜索、子句加权局部搜索和禁忌搜索等。代理会将有效的代码和知识更新到 GitHub 仓库,供其他代理学习和使用。 成果与局限 截至目前,代理已解决了 229 个实例中的 220 个,其中 5 个实例的结果优于竞赛中的最佳成绩,并为 1 个此前无解的实例找到了新解决方案。代理也存在局限性,如并行处理能力低,有时会长时间“钻牛角尖”于单个难题,并且会话时长有限,倾向于在几小时后自行停止。 一份足够详细的规格就是代码 核心观点 文章认为,一份足够详细、足以可靠生成工作代码的规格说明书,其本质就是代码。作者 Gabriella Gonzalez 挑战了当前流行的“AI 代理编码”(agentic coding)概念,指出其倡导者对规格与代码的关系存在误解。 对 AI 编码的批判 许多人误以为规格文档比代码更简单。实际上,为了达到机器可执行的精度,规格文档必须被写成一种“伪代码”,包含了大量与代码相似的结构和细节。作者以 OpenAI 的 Symphony 项目为例,其 SPEC.md 文件充满了为引导模型而添加的冗余描述和直接的代码片段。 避免生成“草率”工作 另一个误解是规格工作比编码更需要深思熟虑。在追求交付速度的行业背景下,规格文档的质量往往会下降,产生缺乏连贯性和全局理解的“草率”内容。AI 代理无法凭空弥补输入文档中缺失的细节,“垃圾进,垃圾出”的原则依然适用。如果首要目标是交付速度,直接编写代码通常是更优选择。 Cook:一个编排 AI 编码任务的命令行工具 项目定位 cook 是一个命令行工具,旨在帮助用户编排与 Claude Code 等 AI 代码生成模型的交互。它通过将复杂的 AI 任务分解为可管理的工作流,来提高代码生成、审查和迭代的效率。 核心操作符 该工具基于三种基本操作: * Work(工作):代表一次 AI 代理调用的核心任务单元。 * Loop operators(循环操作符):用于迭代工作,例如重复 N 次或添加人工审查循环。 * Composition operators(组合操作符):用于并行运行多个方案并对结果进行选择或合并。 使用场景 用户可以通过命令行将这些操作符组合起来,创建复杂的工作流。例如,可以先让 AI 代理生成 N 个不同版本的代码,然后进入一个审查循环,由人类选择最佳方案或提出修改意见,再让 AI 代理进行迭代。该工具还支持 Docker 沙盒模式,以增强安全性。 奥斯汀大规模新建住房有效降低租金 市场变化 美国德州奥斯汀市通过鼓励大规模住房建设,成功抑制了租金上涨。从 2015 年到 2024 年,该市住房存量增加了 30%,是美国整体增长率的三倍多。这直接导致租金下降,到 2026 年 1 月,租金中位数已低于美国整体水平,其中针对低收入租户的老旧公寓租金下降了约 11%。 关键政策改革 奥斯汀采取了多项监管改革措施。其中包括放宽对附属居住单元(ADUs)的建设规定,简化双拼屋和三联排屋的建造流程。2023 年,奥斯汀成为美国第一个取消几乎所有类型物业最低停车要求的主要城市。社区观察者认为,强制停车规定会大幅增加建设成本,取消它是提升住房负担能力的关键一步。 行业影响 奥斯汀的经验被视为一个重要案例,表明增加市场化住房供应也能通过“涓滴效应”惠及更广泛的收入群体。社区普遍认为,这一成功有力地支持了“YIMBY”(Yes In My Backyard)的住房哲学,即增加供给是解决住房危机的有效途径。不过,也有人对这些政策给交通和水资源等基础设施带来的长期压力表示担忧。 钟形曲线无处不在背后的数学原理 中心极限定理 钟形曲线,即正态分布,在自然界和人类社会中普遍存在,从身高体重到考试分数。其背后的数学原理是中心极限定理(Central Limit Theorem, CLT)。该定理指出,当许多独立的随机变量相加时,它们的和的分布会趋向于正态分布,无论原始变量自身的分布是什么形状。 从赌博到科学 对随机性的研究最早源于 18 世纪对赌博的分析。数学家棣莫弗发现,大量重复随机事件(如抛硬币)的结果会遵循一个可靠的模式。后来,拉普拉斯在 1810 年将这一思想发展为中心极限定理,使其成为现代经验科学的支柱。例如,一个人的身高是基因、营养等许多不相关的小因素共同作用的结果,这些因素的累加使其分布近似于钟形曲线。 意义与局限 中心极限定理赋予了统计学家通过样本推断总体的能力。如果没有这个定理,现代统计学可能不复存在。但它也有局限性,它要求样本数量足够多且相互独立。在某些领域,如金融或气候科学中,那些不符合正态分布的极端异常值可能比平均值更重要。 在现实世界中构建康威生命游戏 项目概述 一位开发者制作了一个物理版的康威生命游戏。这是一个在 17x17 的物理矩阵上运行的互动艺术项目,用户可以通过按压带 LED 灯的开关来设置细胞的初始状态,观察其根据简单的规则进行演化。康威生命游戏是一种经典的细胞自动机,简单的局部规则能演化出复杂的全局行为。 硬件实现 该项目使用 AVR128DA64 微控制器作为核心,控制 289 个带 LED 的开关。通过 n 沟道和 p 沟道的 MOSFET 晶体管来驱动 LED 网格的行和列,以提供足够的电流保持亮度。用户输入检测则通过复用行选择线和感知开关的闭合状态来实现。一个电位器连接到微控制器的 ADC 引脚,用于模拟调节游戏的演化速度。 设计与成本考量 项目的主要开销是每个约 3 美元的 NKK 开关。作者认为,虽然使用触摸屏会更便宜,但会失去实体按键的触觉乐趣。为了防止代码崩溃烧坏二极管,固件设计中解耦了屏幕更新和游戏逻辑,并启用了看门狗定时器以确保系统稳定。项目的源代码和 PCB 文件均已公开。 Lotus Notes 的前身:PLATO 系统与协作文化的起源 PLATO 的诞生 PLATO 系统(Programmed Logic for Automatic Teaching Operations)诞生于 20 世纪 50 年代末,是伊利诺伊大学在美国国防部资助下开发的早期计算机辅助教学系统。它在设计上强调用户创作内容和多用户实时协作,这在当时是独一无二的。 “notes”系统的创新 PLATO 系统最重要的功能之一是其“notes”系统。这个最初由两名高中生创建的程序,从一个简单的系统公告板演变为一个通用的应用程序,允许任何用户创建和管理自己的笔记文件,并包含访问控制和内容审核功能。它被认为是早期电子公告板(BBS)和当今社交网络的文化前身。 对后世的影响 PLATO “公共优先”的通信文化对后来的技术发展产生了深远影响。未来的微软首席技术官 Ray Ozzie 在大学期间深度使用 PLATO 系统。他在 80 年代初加入 Lotus 公司后,将从 PLATO “notes”系统中获得的协作理念融入了产品开发,最终影响了 Lotus Notes 等产品的诞生。 说唱歌手 Afroman 在诽谤案中胜诉 事件概述 美国说唱歌手 Afroman 在一起民事诉讼中被裁定不承担诽谤和侵犯隐私的责任。该案由七名曾搜查其住所的警官提起。 案件背景 2022 年,警方对 Afroman 的住所进行了一次毒品搜查,但最终未提出任何刑事指控。Afroman 随后将家中监控记录的搜查画面制作成讽刺性音乐视频,并发布在社交媒体上,视频中包含出警警官的影像。 法律争议 警官们指控 Afroman 的音乐视频和后续的社交媒体帖子侵犯了他们的隐私权,并通过虚假陈述损害了他们的名誉。Afroman 的律师则辩称,这些内容是对公务员行为的社会评论,属于言论自由的范畴。Afroman 在法庭上表示,如果不是警方错误地搜查他的房子,这一切都不会发生。 相关链接: * Austin’s surge of new housing construction drove down rents * Afroman found not liable in defamation case * Astral to Join OpenAI * A sufficiently detailed spec is code * Conway's Game of Life, in real life * The math that explains why bell curves are everywhere * LotusNotes * Autoresearch for SAT Solvers * Cook: A simple CLI for orchestrating Claude Code * Show HN: Duplicate 3 layers in a 24B LLM, logical deduction .22→.76. No training
260318|Mistral AI 发布,网站真的重要Hacker News 今日精选:Mistral AI 发布企业级模型构建系统 Forge,开源工具 Unsloth Studio 让本地训练大模型更简单;同时,我们探讨独立网站的价值,重温编程大师的经典法则,并深入自制 CPU 和 JPEG 压缩背后的技术细节。 Mistral AI 发布 Forge 企业级模型构建系统 弥合通用AI与企业鸿沟 Mistral AI 发布了 Forge 系统,旨在帮助企业利用其内部专有知识构建先进的 AI 模型。多数 AI 模型依赖公开数据训练,而企业运营基于内部文档、代码库和操作流程。Forge 的目标是让 AI 模型能够理解特定企业的内部语境。 核心训练流程 Forge 允许企业在内部数据上进行预训练,使模型内化领域知识。随后通过后训练和强化学习,可以为特定任务优化模型行为,使其与内部政策和操作目标保持一致。该系统支持多种模型架构,包括高效的专家混合(MoE)架构和处理文本、图像等多模态输入的能力。 战略自主与应用场景 Forge 确保企业对模型、数据和知识产权的完全控制,模型可在企业自有基础设施中训练和管理。这在政府、金融等受监管行业中至关重要。软件团队可以基于代码库训练模型以提高工程效率,制造商可用于诊断分析,大型企业则能构建基于内部知识系统的智能体。 Unsloth Studio:本地训练大模型的无代码界面 项目定位 Unsloth Studio 是一个开源、无需编码的 Web 界面,用于在本地计算机(Mac、Windows、Linux)上训练、运行和导出大型语言模型。它提供了一个统一的平台,简化了整个流程。 核心能力 该平台的最大亮点是性能优化。它能以两倍的速度训练模型,同时减少 70% 的显存使用,且不损失准确性。社区用户认为,这种显存效率让消费级硬件也能更好地进行模型微调。 主要功能与隐私 Unsloth Studio 支持通过上传 PDF、CSV 等文件即时开始训练,并能实时追踪训练过程。用户可以将微调后的模型导出为 GGUF 等格式,与 vLLM、Ollama 等工具集成。该工具可完全离线运行,不收集用户遥测数据,保护用户隐私。 为何你应该拥有自己的网站,而非依赖社交媒体 核心观点 商家、艺术家和创作者应该建立自己的网站,而不是仅仅依赖社交媒体平台。一个简单直接的网站是查询关键信息(如价格、营业时间)的更佳途径。 社交平台的风险 过度依赖社交媒体存在风险。平台规则可能一夜之间改变,导致辛苦积累的关注者失效。平台也可能无故封禁账户,用户几乎没有申诉渠道。在这些平台上,用户并不真正拥有自己的内容或关注者数据。 独立网站的价值 拥有自己的网站能提供一个稳定、独立的在线形象,确保业务不受平台政策变动的影响。建立邮件列表是另一种直接联系客户的方式,因为电子邮件是少数不会被轻易剥夺的沟通渠道。社区有成员对此表示认同,希望摆脱这些“围墙花园”的束缚。 重温 Rob Pike 的五条编程法则 (1989) 核心观点 Rob Pike 在 1989 年提出的五条编程法则,至今仍有指导意义。这些法则强调了测量、简洁性和数据结构在软件开发中的核心地位。 性能优化的前提 第一和第二条法则指出,程序的性能瓶颈往往出人意料,因此不应凭猜测进行优化。在没有进行测量之前,不要为了速度而调整代码。只有当代码的某一部分开销远超其他部分时,优化才有意义。 算法选择的智慧 第三和第四条法则建议,对于小规模数据,复杂的算法通常比简单的算法更慢,因为它们有更大的固定开销,而且更难正确实现。因此,应优先使用简单的算法和数据结构。 数据决定一切 第五条法则强调“数据主导”。如果选择了正确的数据结构并妥善组织,算法的设计几乎是水到渠成的。编程的核心是数据结构,而非算法。 自制 8 位 CPU:从仿真到硬件的趟坑实录 项目背景 开发者 Will Warren 分享了他自制 8 位计算机 WCPU-1 的经历,重点记录了从 Logisim 软件仿真到实际硬件构建过程中遇到的挑战。 硬件构建的挑战 实际构建过程充满了意外。作者遇到了 PCB 制造错误、控制逻辑反向、缺少去耦电容、时钟信号质量不佳、寄存器时序错位以及 RAM 异步写入数据损坏等一系列问题。例如,EEPROM 的地址线上存在焊接不良,导致引脚浮空并读取到随机数据。 解决方案与成果 通过细致的调试,作者逐一解决了这些问题。他使用施密特反相器整形时钟信号,调整寄存器锁存时机以避免总线争用,并通过门控逻辑确保 RAM 在正确的时机写入。最终,这台自制的 CPU 成功以 1MHz 的频率运行,并能正确执行所有测试程序,证实其图灵完备。 JPEG 压缩算法是如何工作的 问题背景 JPEG 是一种利用人类视觉系统特性进行图像压缩的算法。它通过转换图像表示方式,将信息集中在人类最敏感的信号上,从而可以丢弃大部分不敏感的细节。 核心步骤 压缩过程首先将图像从 RGB 色彩空间转换为 Y'CbCr 空间,分离出亮度和色度信息。由于人眼对亮度比对颜色更敏感,算法会降低色度通道的空间分辨率(色度子采样)。接着,图像被分成 8x8 的像素块,并通过离散余弦变换(DCT)从空间域转换到频率域。最后,通过量化步骤,将高频系数(对应图像细节)除以一个较大的数并取整,使许多高频信息变为零。 数据编码 量化后的系数通过 Z 字形扫描重新排序,将低频系数和连续的零值聚集在一起。这些数据最终使用霍夫曼编码进行无损压缩,为频繁出现的值分配更短的编码,从而完成整个压缩过程。 相关链接: * Have a fucking website * Mistral AI Releases Forge * Rob Pike's Rules of Programming (1989) * Show HN: Sub-millisecond VM sandboxes using CoW memory forking * More than 135 open hardware devices flashable with your own firmware * The pleasures of poor product design * JPEG Compression * Write up of my homebrew CPU build * Unsloth Studio * Nightingale – open-source karaoke app that works with any song on your computer
260317|SEC取消季报,Meta巨额游说今日 Hacker News 精选:深入探讨软件开发中的审批效率瓶颈,逆向工程并开源 AI 助手,以及在浏览器中运行 Python 的 Pyodide 项目。 每个审批层级让效率降低十倍 审批的指数级延迟 软件开发中每增加一个审批层级,任务完成的“挂钟时间”就会增加约十倍。修复一个 Bug 可能只需 30 分钟编码,但代码审查(Code Review)可能耗时 300 分钟,设计文档审批则长达 50 小时。这种延迟主要来自等待,而非实际工作。 AI 可以加速编码,但无法解决审查瓶颈。如果 AI 生成大量未经仔细审查的代码,只会增加审查者的负担。社区有观点认为,AI 或许能提升提交内容的质量,让审查者能专注于更高层面的问题,从而间接优化流程。 问题的根源:对错误的恐惧 组织采用多层级审查,是因为随着公司规模扩大,错误造成的损失呈指数级增长。当新功能的平均价值低于其可能引发的 Bug 造成的损失时,增加控制层级似乎是必然选择。这种模式反映了对持续质量改进的追求,但往往导致效率低下。 独立的质量保证(QA)团队可能扭曲激励机制。当开发团队知道有后续审查时,自我检查的动力会减弱,团队间缺乏信任,导致问题无法在源头解决。 根本解法:信任与模块化 真正的解决方案是减少审查层级,并建立“全面质量”文化。质量需要工程师从头到尾将其“工程化”到系统中,而非通过审查来保证。审查者的职责应转变为思考如何从根本上消除某一类错误,例如通过自动化工具消除代码格式的争论。 实现这一目标的关键在于模块化。通过构建小而高质量的独立组件,并建立团队间的信任,可以显著减少上层系统的审查负担。AI 的快速编码能力有助于加速高质量模块的构建和重构,让“双披萨团队”变得更小、更高效。 逆向工程并开源 AI 助手 Viktor 探索 AI 助手内部 一位开发者对 AI 助手 Viktor 进行了逆向工程。Viktor 声称能连接 3000 多种工具,像“AI 同事”一样完成工作。开发者通过测试,成功让 Viktor 备份了其工作区文件,并最终获取了包含内部代码的完整文件系统。 核心发现:SDK、日志与提示 分析文件后,开发者发现了 Viktor 的内部结构。其核心包括一个包含各种工具集成的 SDK、记录了详细操作流程的日志文件,以及 19 个“技能”文件夹。这些“技能”本质上是精心编写的提示(Prompts),用于指导 AI 执行复杂的业务逻辑,例如如何从 Slack 对话中挖掘自动化机会。 重建与开源 开发者将这些逆向工程获得的文件和文档输入大型语言模型 Claude Code,让其重建系统架构。基于这份详细规范,他花了两天时间重新实现了整个系统,并将其命名为 OpenViktor,在 GitHub 上开源,提供了一个可自托管的版本。 《Teardown》多人模式的实现历程 核心挑战:同步可破坏的世界 为物理引擎游戏《Teardown》添加多人模式是一项艰巨任务。游戏世界完全可破坏,这使得通过网络在多个客户端之间精确同步物理效果变得极其困难。早期的实验因传输大量体素数据而导致带宽瓶颈。 混合同步方案 开发团队最终采用了一种混合方法。对于环境破坏,他们将逻辑重写为确定性的定点整数运算,并将每个破坏事件拆分为一系列确定性命令流,在所有客户端上精确重放,保证场景内容一致。对于物体位置、速度等动态状态,则采用状态同步,由服务器定期向客户端发送更新,客户端在本地模拟并根据服务器数据进行校正。 兼容性与中途加入 向后兼容性是开发中最耗时的部分。为了让现有的单人游戏模组能在多人模式下继续运行,团队付出了大量努力来保持 API 的兼容性。实现“中途加入”功能也极具挑战,团队通过记录和重放确定性命令流,让新加入的玩家能够同步到当前的游戏世界状态。 Pyodide:基于 WebAssembly 的 Python 发行版 项目定位 Pyodide 是一个基于 WebAssembly 的 Python 发行版,它将 CPython 解释器移植到了浏览器和 Node.js 环境中。开发者可以直接在 Web 环境中运行 Python 代码。 核心能力 Pyodide 提供了强大的功能。它内置了一个名为 micropip 的包管理器,可以直接在浏览器中安装纯 Python 包。许多流行的科学计算库,如 NumPy、pandas 和 Matplotlib 也已被移植支持。它还提供了强大的 JavaScript 与 Python 交互接口,支持异步操作,并允许 Python 代码直接访问浏览器提供的 Web API。 Reddit 用户揭露 Meta 20 亿美元的年龄验证游说活动 游说目标:操作系统级 API 一位 Reddit 研究员发现,Meta 公司通过非营利性空壳组织,在全美范围内斥资 20 亿美元进行游说,旨在推动具有侵入性的年龄验证技术。其核心目标是强制苹果和谷歌在操作系统层面构建 API,用于查询用户年龄数据。这可能在每台设备上创建一个永久的身份层,并实现设备指纹识别追踪。 策略:豁免自身平台 这些被提议的年龄验证法案,其适用范围专门针对苹果的 App Store 和 Google Play 等平台,但巧妙地豁免了 Meta 自己的社交媒体平台。社区观点认为,这暴露了“儿童安全”口号背后,可能隐藏着将责任从内容平台转移给操作系统制造商的竞争策略。 欧盟的隐私保护方案 与此形成对比的是,欧盟的 eIDAS 2.0 法规提供了一种保护隐私的年龄验证方案。其“数字身份钱包”利用零知识证明技术,允许用户在不泄露具体生日或身份信息的情况下证明自己已成年。该方案开源且可自托管,只适用于大型平台。 美国证交会或将取消季度财报强制要求 提案内容 美国证券交易委员会(SEC)正准备提出一项新规,允许上市公司选择性地进行半年度财务报告,而非当前强制的季度报告。这项提案最早可能在下个月发布,之后将进入公众意见征询期。 支持与反对观点 支持者认为,取消季度报告可以帮助上市公司摆脱“短期主义”,更专注于长期战略目标,同时降低合规成本。反对者则警告,减少信息披露频率会降低市场透明度,并可能加剧股价的波动性。 Kagi 推出“小众网络” 探索非商业化内容 Kagi 搜索引擎推出了“小众网络”(Small Web)功能,旨在帮助用户发现来自个人博客、爱好者网站、学术页面等非商业化的互联网内容。这个功能致力于对抗被 SEO 和商业内容主导的搜索结果。 “小众网络”的特点 在“小众网络”中找到的内容通常由个人或独立创作者维护,专注于特定的兴趣分享。例如,用户可能会发现一个分享小众乐队音乐视频的个人博客,页面设计简单,没有广告,只专注于内容本身。 Kagi 翻译新增“领英体”输出 一键生成职场黑话 Kagi Translate 工具增加了一项新功能,可以将文本翻译成“LinkedIn Speak”(领英体)。这种文体常见于职业社交平台 LinkedIn,其特点是充满了企业行话、过度积极的语气和标准化的表达方式。现在用户可以一键将普通文本转换成这种独特的职场交流风格。 科幻短片《反模因部》 剧情简介 科幻短片《反模因部》(There Is No Antimemetics Division)讲述了一个特殊部门对抗“反模因实体”的故事。这些实体具有吞噬记忆的特性,导致人类难以察觉或记住它们的存在。影片主角作为部门负责人,需要在自己也可能被影响的情况下,证明自己的身份和部门的价值。 概念来源:SCP 基金会 影片的“反模因”概念源于知名的网络共创项目“SCP 基金会”。在 SCP 的世界观中,“模因”是像病毒一样传播的思想,而“反模因”则是那些自身存在就难以被记忆和理解的异常现象。社区观众对影片评价很高,认为它成功地将这个抽象的宇宙恐怖概念视觉化,并称赞了主演的精彩演绎。 相关链接: * Kagi Translate now supports LinkedIn Speak as an output language * US SEC preparing to scrap quarterly reporting requirement * Kagi Small Web * Every layer of review makes you 10x slower * Reddit User Uncovers Who Is Behind Meta's $2B Lobbying for Age Verification Tech * Microsoft's 'unhackable' Xbox One has been hacked by 'Bliss' * Reverse-engineering Viktor and making it open source * Sci-Fi Short Film “There Is No Antimemetics Division” [video] * The unlikely story of Teardown Multiplayer * Pyodide: a Python distribution based on WebAssembly
260316|Polymarket威胁,伊朗导弹事件,大麻素清除阿尔茨海默病今日 Hacker News 精选:探讨如何与 LLM 高效协作编程,重温浮点数运算的经典知识,并关注预测市场与金融规则对现实世界的影响。 与大型语言模型协作编程 从程序员到“制造者” 一位开发者分享了他利用大型语言模型(LLM)编写软件的经验。他认为 LLM 使他能以更低缺陷率、更快速度构建更高质量的项目,将自己定位为“制造者”而非单纯的程序员。他的工程技能并未过时,而是从编写具体代码转向设计系统架构和做出可用性决策。 多模型协作框架 他的工作流依赖一个名为 OpenCode 的工具,该工具具备两个核心功能: 1. 使用多个模型:他将不同公司的模型(如 Claude Opus、Codex、Gemini)视为各有专长的独立个体。让不同模型进行代码审查,能像获得“第二双眼睛”一样带来显著改进。 2. 定义可互相调用的代理(Agent):通过定义不同角色的代理并让它们互相调用,可以避免在模型间手动传递大量信息,提升了效率。 架构师-开发者-评审员工作流 他的工作流由三个代理组成: * 架构师(Claude Opus):开发者只与该代理直接交互,用于阐述高级目标、讨论并确定最终架构。这个过程产出详细到文件和函数的低级别计划。 * 开发者(Sonnet):使用一个较弱的模型,严格按照计划实现代码更改。 * 评审员(Codex/Gemini/Opus):多个评审员独立审查代码,提出批评。反馈会返回给开发者进行迭代。 人类经验不可或缺 开发者强调,在整个过程中,他会利用自身经验大量纠正 LLM 的建议,使项目带有个人印记。当他对底层技术不够熟悉,无法判断 LLM 的架构决策时,项目可能会陷入混乱。这说明,即使有 LLM 辅助,人类的架构能力和技术理解力仍然至关重要。 停止未经思考地粘贴 AI 内容 什么是“Sloppypasta” “Sloppypasta”是一个新词,指将未经阅读、提炼、核实的 LLM 输出内容直接复制粘贴给他人。这种行为将验证和理解的负担转移给了接收者,被认为是一种不礼貌的沟通方式。 努力不对称与信任侵蚀 “Sloppypasta”破坏了沟通中的平衡。LLM 让写作的成本几乎为零,但阅读和验证的成本却增加了,给接收者带来认知负担。同时,由于 LLM 存在“幻觉”(生成看似合理但错误的信息),这种行为会侵蚀发送者自身的信誉,并破坏沟通中的信任基础。 如何有效利用 AI 为了避免制造“Sloppypasta”,文章提出了几条指导原则: 1. 阅读:分享前亲自阅读 AI 的输出。 2. 验证:核查所有事实性信息。 3. 提炼:将冗长的回复精简为核心要点。 4. 披露:说明 AI 在内容创作中扮演的角色。 5. 按需分享:只在对方请求时才分享 AI 生成的长篇内容。 6. 使用链接:用链接或附件代替大段文字,避免占据对方的屏幕空间。 核心观点是,利用 AI 加速工作,而不是让它取代你的思考。 计算机科学家应知的浮点数算术(1991) 舍入误差的本质 由于计算机使用有限的位数表示无限的实数,浮点计算本质上存在舍入误差。当两个相近的数字相减时,可能发生灾难性抵消,导致结果的有效数字大量损失。为了提高精度,硬件设计中的保护位(guard digit)非常重要。许多看似简单的公式,如二次方程求解,需要通过数学上的重写来避免数值不稳定的问题。 IEEE 754 标准的贡献 IEEE 754 标准统一了浮点数的表示和计算方法,确保了软件在不同平台间的可移植性。该标准定义了加、减、乘、除等基本运算必须精确舍入,即计算结果如同在无限精度下完成再进行舍入。 标准还引入了特殊值来处理异常情况,使计算可以继续进行: * NaN(Not a Number):表示 0/0 等未定义结果。 * 无穷大(±∞):处理上溢(overflow)情况。 * 非规范化数(Denormalized numbers):实现了渐进式下溢(gradual underflow),填补了零与最小规范化数之间的空白,保证了 x - y = 0 当且仅当 x = y。 对系统设计的影响 浮点数的特性对编译器和语言设计提出了要求。编译器优化不能随意套用实数的代数恒等式(如分配律),否则可能破坏算法的数值稳定性,例如经典的 Kahan 求和公式。这提醒开发者和系统设计者,浮点数变量的行为与数学上的实数存在关键差异。 纳斯达克为吸引大型 IPO 修改指数规则 规则变更的核心 纳斯达克提议修改纳斯达克 100 指数的纳入规则,被指旨在吸引 SpaceX 等大型公司的首次公开募股(IPO)。关键变更包括: 1. 快速纳入:市值排名前 40 的新上市公司,可在上市 15 天后被纳入指数,豁免了常规的考察期和流动性要求。 2. 低流通股权重乘数:对于公众可交易股份(free float)低于 20% 的公司,其指数权重将按其自由流通股比例的五倍计算。 对被动投资者的影响 这些规则可能导致追踪纳斯达克 100 指数的被动型基金(如 ETF)被迫以被人为推高的价格买入新上市公司的股票。例如,如果一家公司仅发行 5% 的流通股,其在指数中的权重将被计算为 25%(5% 乘以 5),导致巨额被动资金在股票流动性极低的情况下涌入,为内部人士和早期投资者创造了有利的退出条件。 市场操纵的质疑 评论认为,这种机制相当于将财富从散户投资者的退休账户转移到公司内部人士手中。更严重的是,当 IPO 锁定期结束后,内部人士可以大量抛售股票,而指数的季度再平衡规则可能恰好在同一时间强制被动基金买入更多股票,为这些抛售行为提供了接盘资金。社区观点普遍认为,此举损害了指数的完整性,并呼吁监管机构介入。 机器人执行器中电机缩放定律与惯性 电机性能的品质因数 文章探讨了机器人执行器中电机的物理特性。通过分析电机的尺寸缩放定律,作者提出了一个“归一化电机常数”作为品质因数(FoM)。这个指标仅由材料属性决定,与电机尺寸无关,可以有效比较不同尺寸电机在磁性材料效率方面的表现。数据分析显示,市售的无框电机大多遵循这个规律。 反射惯量与传动比无关 文章得出了一个与直觉相反的结论:在给定输出扭矩和功耗的情况下,执行器的反射惯量(reflected inertia)主要由功耗决定,而与传动比或电机尺寸几乎无关。这意味着,无论采用直接驱动还是多级减速,只要输出扭矩和电机功耗相同,电机端的惯性表现基本一致。 模型的局限性 作者也指出,这个品质因数模型并未涵盖峰值扭矩、磁饱和、热传递等复杂因素,并且假设了齿轮传动是理想的。尽管如此,它仍然为理解和设计机器人执行器提供了有价值的参考。 预测市场赌徒为赢取赌注威胁记者 事件概述 《以色列时报》的一名记者因报道一枚伊朗导弹落在以色列境内而收到死亡威胁。一群在预测市场 Polymarket 上下注的赌徒是威胁的来源。他们在“伊朗是否会在 3 月 10 日袭击以色列?”这一事件上押注了超过 1400 万美元。 利益冲突的根源 根据 Polymarket 的规则,“被拦截的导弹”不足以让押注“是”的一方获胜。因此,押注“否”的赌徒们试图向记者施压,要求他将报道中的“导弹袭击”改为“拦截器碎片”,以确保自己赢得赌注。威胁从最初的邮件骚扰升级为针对记者及其家人的死亡威胁。 对新闻业的警示 Polymarket 平台谴责了这种行为并封禁了相关账户。然而,这一事件暴露了预测市场可能对现实世界产生的负面影响。当新闻报道的客观事实与巨大的经济利益直接挂钩时,记者可能面临被操纵或被收买的压力。社区评论普遍担忧,这种机制模糊了事实与利益的界限,侵蚀了新闻业的诚信。 大麻素可清除阿尔茨海默病相关蛋白(2016) 实验室研究发现 一篇 2016 年发表于《衰老与疾病机制》的研究报告指出,大麻素(cannabinoids)可以促进神经细胞清除与阿尔茨海默病相关的有毒蛋白 β-淀粉样蛋白(amyloid beta)。这项研究在实验室培养的人类神经元中进行。 双重作用机制 研究显示,当神经元暴露于四氢大麻酚(THC)时,不仅β-淀粉样蛋白水平降低,由该蛋白引起的细胞炎症反应也被消除,从而帮助神经细胞存活。这是首次证明大麻素能同时影响炎症和β-淀粉样蛋白的积累。 研究背景与展望 大脑中的内源性大麻素系统参与了多种生理过程,而体育锻炼可以促进其产生。研究人员强调,这项发现仍处于初步阶段,需要在临床试验中进一步验证,才能作为阿尔茨海默病的潜在治疗方法。 Bandit:运行 Color Forth 的裸机计算机 项目简介 BANDIT 是一款 32 位手工制作的裸机(baremetal)计算机。它不依赖任何操作系统,直接在硬件上运行 Color Forth。Color Forth 是 Forth 编程语言的一种极简主义方言,以其独特的视觉化语法而闻名。 相关链接: * Polymarket gamblers threaten to kill me over Iran missile story * How I write software with LLMs * Cannabinoids remove plaque-forming Alzheimer's proteins from brain cells (2016) * The Linux Programming Interface as a university course text * Electric motor scaling laws and inertia in robot actuators * What every computer scientist should know about floating-point arithmetic (1991) [pdf] * Stop Sloppypasta * A new Bigfoot documentary helps explain our conspiracy-minded era * Bandit: A 32bit baremetal computer that runs Color Forth [video] * Nasdaq's Shame
260315|空客无人战机,耳机检出有害物Hacker News 今日精选:深入内核反作弊机制,探索语言模型推理新范式,以及专为挑战法规而生的 Linux。 内核反作弊系统如何运作 为何需要深入内核 现代游戏的反作弊系统运行在操作系统的最高权限级别(Ring 0,内核模式),因为仅在用户模式(Ring 3)的保护措施,很容易被更高权限的作弊程序绕过。作弊开发者利用内核驱动直接读写游戏内存、隐藏自身进程,使得用户模式的反作弊形同虚设。这引发了一场持续升级的“军备竞赛”:从用户模式作弊,到内核作弊,再到内核反作弊,作弊方进而使用虚拟机监控(Hypervisor)和 PCIe DMA 硬件设备等技术,层层深入系统底层。 核心监控与防御机制 内核反作弊系统通常采用三层架构:内核驱动、用户模式服务和注入到游戏的 DLL。其核心防御能力依赖于 Windows 内核提供的一系列回调 API。 * 访问控制:通过 ObRegisterCallbacks 监控进程句柄的创建,能阻止外部程序获取对游戏内存的读写权限,像是为游戏进程配备了一位“内存保安”。 * 进程与线程监控:利用 PsSetCreateProcessNotifyRoutineEx 和 PsSetCreateThreadNotifyRoutine 监视系统中的新进程和线程,可以实时发现并阻止已知的作弊工具启动,或识别注入到游戏中的可疑代码。 * 内存扫描:反作弊驱动会定期扫描游戏内存,通过哈希比对检测核心代码是否被篡改。它还会遍历进程的虚拟地址描述符树(VAD tree),寻找没有对应模块、被“手动映射”进内存的可疑代码。 * 钩子检测:作弊程序常通过“钩子”(Hook)拦截游戏与系统的交互。反作弊系统会扫描关键函数,检查是否存在 JMP 等跳转指令,以发现被篡改的执行流程。 前沿对抗与未来 当前的攻防前沿是 DMA 作弊。作弊者使用特制硬件通过 PCIe 总线直接读写物理内存,完全绕过操作系统和软件层面的检测。对此,IOMMU(输入/输出内存管理单元)和基于 TPM 的安全启动提供了硬件层面的防御思路。 此外,AI 驱动的作弊是下一个重大威胁。由计算机视觉模型驱动的作弊工具,通过独立的硬件设备模拟鼠标输入,从软件层面看与真人玩家无异。这使得基于玩家行为分析的机器学习检测变得至关重要。尽管内核级反作弊带来了隐私和安全风险,但在硬件认证普及之前,它仍是当前最有效的防御手段。 空客公司为无人作战飞机做准备 引进“女武神”平台 空中客车公司正从其美国合作伙伴 Kratos 购入两架“女武神”(Valkyrie)无人机,并计划在德国进行改装。此举旨在为德国空军提供一个作战级的无人协同作战飞机(UCCA)系统,目标是在 2029 年前投入使用。 欧洲“大脑”与人机协同 改装的核心是集成一套名为 MARS 的欧洲自主任务系统,其内置一个由 AI 支持的软件大脑“MindShare”。该系统不仅能替代飞行员的部分角色,还能跨平台协调有人和无人机组成的整个作战编队,实现“有人-无人协同作战”(MUM-T)。 提升作战能力 这些无人机将能执行对载人飞行员而言风险过高的敏感任务。“台风”(Eurofighter)战斗机也将进行相应升级,以作为指挥机,增强其连接能力和航空电子设备,从而提升整个编队的作战杀伤力。空中客车公司表示,此举能以经济实惠的方式快速提供当前地缘政治局势所需的可信战斗能力。 SBCL Fibers:轻量级协程线程 问题背景:线程与事件循环的困境 在高并发服务器场景中,为每个连接创建一个操作系统(OS)线程会消耗大量内存和调度资源。而事件驱动编程虽然高效,但其回调式的编程模型会颠倒控制流,使代码逻辑碎片化,错误处理和调试变得困难。 Fibers:兼顾效率与可读性 SBCL Fibers 为 Common Lisp 提供了轻量级的协同式线程(协程)。它们在用户空间由库进行调度,而非内核。一个 Fiber 的默认栈大小仅为 256 KB(OS 线程通常为 8MB),上下文切换开销极低。这使得系统可以轻松支持数万个并发 Fiber,同时保留了传统线程模型的顺序编程逻辑,让代码更易读写。 核心特性 * 透明集成:现有的阻塞操作(如锁、条件变量、I/O 等待)在 Fiber 环境下会自动切换为非阻塞的协同式“让步”,无需修改代码。 * 高性能:上下文切换由手写的汇编代码实现,热路径上无堆内存分配,切换时间达到亚微秒级。 * 多核利用:通过无锁的“工作窃取”(Work-stealing)队列,空闲的 OS 载体线程会自动从其他繁忙线程的队列中“窃取”任务,实现负载均衡。 * I/O 多路复用:在 Linux 上利用 epoll 实现高效的 I/O 事件处理,确保大量等待 I/O 的 Fiber 不会占用 CPU。 用树搜索蒸馏提升语言模型推理能力 核心观点 将游戏 AI(如 AlphaZero)中成功的“搜索蒸馏”技术应用于语言模型,可以提升其推理能力。该方法通过树搜索(MCTS)探索更优的解题路径,再利用强化学习(PPO)将这些更强的推理能力“蒸馏”回模型本身。 实验方法 研究者在一个名为“Countdown”的数学组合游戏中进行了实验。他们使用一个 15 亿参数的 Qwen 模型,通过并行蒙特卡洛树搜索来生成高质量的推理轨迹。随后,这些轨迹被用作训练数据,通过在线 PPO 循环来优化模型。这个过程就像让模型先“集思广益”找到最佳答案,然后再“复盘学习”,从而让自己变得更聪明。 实验结果与思考 经过蒸馏的模型在评估任务上的表现显著优于基线模型(提升 8.2 个百分点)。有趣的是,另一种“Best-of-N”(从 N 次生成中选最优)的蒸馏方法效果反而更差。研究者推测,如果没有树搜索这种结构化的探索过程来激励模型产出鲁棒的推理步骤,模型很难学会提升单次生成的质量。不过,作者也指出这可能是一种“小模型现象”,该方法对更大模型的扩展性仍有待验证。 Ageless Linux:为挑战年龄验证法案而生 项目定位 Ageless Linux 是一个基于 Debian 的操作系统发行版,其唯一目的是公开、蓄意地不遵守《加州数字年龄保障法案》(AB 1043)。该法案要求操作系统和应用提供商实施年龄验证。 核心论点 项目方认为,该法案的真正目的是为大型科技公司(如苹果、谷歌)建立“合规护城河”,因为它们已有现成的年龄验证系统,合规成本极低。而对于由志愿者和非营利组织维护的开源项目(如 Debian),构建此类系统的成本和法律风险是难以承受的。这会迫使许多开源项目停止在加州分发软件。 行动计划 Ageless Linux 通过一个简单的转换脚本,修改系统标识文件,将任何 Debian 系统变为“Agרוב Linux”,从而使安装者也成为法律意义上的“操作系统提供商”。项目还计划推出预装该系统的廉价单板计算机“Ageless Device”,并分发给未成年人,以此制造明确的违规案例,挑战该法案的合理性与可执行性。 大黄蜂蜂后可在水下呼吸存活一周 惊人发现 一项研究偶然发现,处于滞育期(昆虫的冬眠状态)的东部大黄蜂蜂后,即使被完全淹没在水中,也能存活长达一周。这一能力解释了在地下过冬的蜂后如何应对融雪或暴雨导致的土壤淹水。 生存机制 研究表明,蜂后结合了两种策略来生存。首先,它们可以在水下进行呼吸,通过吸收水中的溶解氧并释放二氧化碳来维持基本代谢。其次,它们还能进行无氧代谢,在缺氧时产生乳酸来供能。蜂后在滞育期间极低的代谢率是这一切的关键,这大大降低了它们对氧气的需求。 未解之谜 目前,科学家尚不清楚蜂后是如何从水中获取氧气的,推测可能与其毛茸茸的身体捕获的微小气泡层(物理鳃)有关。这一发现为昆虫生态学和保护工作提供了新的视角,强调了冬季地下生存环境的重要性。 请让我了解真实的你,包括那些不完美 沟通的“过敏反应” 作者指出,对于经由大型语言模型(LLM)润色过的文本,尤其是在个人沟通中,他会产生一种“过敏反应”。因为 LLM 会模糊发送者的真实意图和个人风格,剥夺了接收者根据长期积累的、关于对方写作习惯的“隐性知识图谱”来解读信息的能力。 破坏“社交握手” 将文本通过“通用化器”处理,会破坏人际沟通中的“同步过程”。那些不完美的措辞、独特的语气,甚至是错误,都是真实人性的一部分,是建立深层共鸣的基础。过度依赖 LLM 会让沟通变得扁平、缺乏灵魂。 社区观点 社区讨论认为,关键在于平衡。对于非母语者修正语法,或在处理大量信息时进行总结,LLM 是有用的辅助工具。但若将其作为个人思考和表达的完全替代品,则可能导致沟通的非人化。 陶哲轩发起数学蒸馏挑战赛 挑战目标 数学家陶哲轩(Terence Tao)发起了一项挑战,旨在探索如何将海量的数学真假结果“蒸馏”成一个简短、人类可读的“备忘录”(cheat sheet)。这个备忘录的目标是显著提升廉价 AI 模型解决泛代数问题的能力。 比赛形式 挑战赛的第一阶段要求参与者创建一个小于 10KB 的备忘录,以最大化 AI 在一系列公开问题上的表现。这类似于计算复杂性理论中的 P/Poly 类,备忘录扮演了“建议字符串”的角色,用少量信息辅助计算。 未来展望 表现优异的参与者将进入第二阶段,届时需要让 AI 提供更复杂的证明或反例。陶哲轩希望获奖的备忘录能揭示解决这类问题的有效技术,并为未来人机协作解决数学问题提供通用策略。 GrobPaint:介于画图和 Paint.NET 之间的图像编辑器 项目定位 GrobPaint 是一款轻量级的多平台图像编辑器,旨在填补微软画图(MS Paint)功能过简与 Paint.NET/Photoshop 功能过剩之间的空白。它为需要图层、混合模式等核心功能的用户提供了一个简洁的选择,尤其适合 macOS 用户。 核心功能 该工具支持图层管理、16种混合模式、多种绘图和选择工具(包括魔棒)、HSV 颜色选择器、多文档标签页以及自定义项目格式 .gbp,该格式能完整保留图层信息。 技术架构 GrobPaint 的架构十分轻巧:前端使用纯 JavaScript,无任何打包或构建步骤;后端是一个 Python HTTP 服务器,通过 pywebview 启动一个原生桌面窗口。这种设计使得项目既可以作为独立应用运行,也可以直接在浏览器中打开。 所有被测耳机均含有害化学物质 研究发现 一项由欧盟资助的项目在欧洲五国进行的研究发现,所有被分析的 81 款耳机,无论品牌和价格,均含有有害化学物质。最常见的是双酚类化合物(如 BPA 和 BPS),这类物质是已知的内分泌干扰物。 “遗憾性替代”与监管漏洞 研究证实了“遗憾性替代”的趋势,即被禁用的有害物质被结构相似、但毒性可能同样严重的替代品所取代。例如,一些旧的阻燃剂被新的有机磷阻燃剂替代,后者同样与神经毒性有关。研究还发现,从国际在线市场购买的样品中,有害物质含量最高。 专家呼吁 项目专家呼吁欧盟放弃逐个禁用化学物质的缓慢监管方式,转而采取对整个化学品类别(如所有双酚类化合物)进行限制的策略。他们认为,这才能有效保护消费者,并促进一个无毒的循环经济。 相关链接: * Ageless Linux – Software for humans of indeterminate age * Airbus is preparing two uncrewed combat aircraft * How kernel anti-cheats work * SBCL Fibers – Lightweight Cooperative Threads * Tree Search Distillation for Language Models Using PPO * Bumblebee queens breathe underwater to survive drowning * Allow me to get to know you, mistakes and all * Mathematics Distillation Challenge – Equational Theories * Show HN: GrobPaint: Somewhere Between MS Paint and Paint.net * Hazardous substances found in all headphones tested by ToxFREE project