

260518|宇航员问答录像,核试残骸晶体今日Hacker News精选聚焦于提升开发者效率的工具与技术,从语言编译器优化到智能代码搜索及隐私友好的笔记系统。 Jank 语言引入自定义 IR,性能逼近 JVM 性能突破与优化路径 Jank(Clojure 方言)通过引入自定义中间表示(IR)显著提升了执行速度。在递归斐波那契基准测试中,初始版本耗时 5522 毫秒,而 JVM 基线(OpenJDK 21)约为 200 毫秒。团队通过五步优化将 Jank 时间降至 114 毫秒,约是 JVM 基线的两倍速度。 自定义 IR 设计与关键优化 该 IR 基于 SSA 形式和控制流图,操作在 Clojure 语义层而非底层字节码。优化步骤包括:为算术函数添加内联移除变量解引用和装箱开销;消除布尔分支中的冗余指令;将 nil 表示改为全局 nullptr 以减少分配;使用 64 位指针的低三位编码小整数以避免动态内存;对核心算术函数应用强力内联编译器提示。 实际应用与未来计划 该工作流现在可用于更大基准,例如光线追踪,目标是在实际工作负载中保持速度优势。开发者强调,尽管原生 AOT 缺少 JVM 的自适应 JIT,但 Jank 证明了通过语义贴合的运行时和 IR 调优,Clojure 方言可与 JVM 竞争。社区成员指出,这保留了 Clojure 的动态特性,而纯 C++ 实现虽然更快但会牺牲这些特性。 Semble:为AI代理构建的高效代码搜索工具 极致的搜索效率与准确性 Semble 是一个零依赖的代码搜索库,专为 AI 代理设计。它通过将代码分割为语意块并融合语义与词法匹配,在消耗极少 token 的情况下即时返回精准片段。基准测试显示,其索引速度比代码特化Transformer快 218 倍,查询延迟约 1.5 毫秒;检索质量 NDCG@10 达 0.854,相当于 137M 参数模型的 99%;相比 grep+read,token 消耗减少约 98%,仅需 2k token 即可达到 94% 召回率。 技术实现与工作流 Semble 使用 tree-sitter 将文件切分为语意块,采用 Model2Vec 静态嵌入(基于 potion-code-16M)处理语义相似度,用 BM25 处理词法匹配,二者通过倒数排名融合(RRF)结合。结果再通过代码感知信号重新排序:符号查询提升词法权重,定义块获排名加成,标记词干匹配,同文件多块提升相关度,以及对测试文件等噪声的惩罚。典型工作流是:先用 semble search 定位相关块,仅在上下文不足时检查完整文件;用 semble find-related 探索相关实现;仅在需要精确字符串匹配时回退到 grep。 零设置与实际应用 该工具完全在 CPU 上运行,无需 API key、GPU 或外部服务。可通过 pip install semble 安装,或在 AGENTS.md 中配置为 MCP 服务器,使 Claude Code、Cursor 等代理直接调用。开发者强调,其本地优先设计确保数据不离开机器,适合注重隐私的开发场景;社区反馈表明,在大型代库中,它显著减少了代码探索的延迟。 Files.md:开源本地优先的Obsidian替代方案 隐私友好的纯文本笔记系统 Files.md 是一个开源笔记应用,将所有内容存储为普通的 Markdown 文件,采用本地优先模式确保数据不发送至服务器。它提供多种同步方式而无需自建基础设施:默认仅存储于设备本地;可利用 iCloud/Dropbox/Google Drive 等云文件夹实现跨设备同步;或运行一个可选集成 Telegram 机器人的 Go 二进制文件作为自托管服务器;还提供即时试用的托管版。 核心功能与设计理念 该应用强调零依赖安装:仅需在浏览器中打开 app.files.md 即可离线使用。内置功能包括聊天式快速记事(通过聊天框或 Telegram 机器人导入内容)、使用 [ 创建双向链接构建知识网络、以及常用热键如 Cmd+P 触发文件搜索。随附的 Go 脚本支持诸如将维基链转为 Markdown 或迁移日志时间戳等实用任务。设计理念倡导极简代码以便人类和大语言模型阅读,鼓励用户先用大脑思考再用工具记录,以避免过度依赖 AI 工作流导致的思考延迟。 社区采纳与实际使用 项目已维护五年,获得约 913 星标。使用建议是从零结构开始,每笔记记录一个独立观点,及时将新知识应用于实践,并定期回顾笔记以建立关联。开发者指出,其纯文本天然适合长期保存和与大语言模型交互,吸引了寻求透明、可编辑知识库的用户;社区成员分享,在将其用于项目文档后,发现跨引用维护比传统 wiki 更直截了当。 相关链接: * It is time to give up the dualism introduced by the debate on consciousness * Ask an Astronaut: 333 hours of Q&A footage with astronauts * Jank now has its own custom IR * Strange crystals found inside wreckage from the first nuclear bomb test * Show HN: Semble – Code search for agents that uses 98% fewer tokens than grep * WriteUp: 16 Bytes of x86 that turn Matrix rain into sound * A Good Lemma Is Worth a Thousand Theorems (2007) * Cannibalistic attacks between gray seals leave telltale “corkscrew” injuries * Show HN: Auto-identity-remove – Automated data broker opt-out runner for macOS * Show HN: Files.md – Open-source alternative to Obsidian
260516|前沿AI破CTF, Δ-Mem高效记Frontier AI has broken the open CTF format 核心观点 AI 代理已能够自动解决绝大多数中等难度 CTF 题目,传统比分不再反映人类安全技能。 论证逻辑 GPT‑4 问世后,部分中等难度题目可通过单次 prompt 得到答案;Claude Opus 4.5 及其 CLI 工具使编排 AI 代理变得 trivial,快速拿下简单题留出人力仅用于最难题;后续 GPT‑5.5 能一击解决 Insane 堆溢出题目,令比赛变成“谁能负担更多算力”。 延伸思考 初学者若直接使用 AI 将失去挣扎学习的机会,挑战作者动机转向教育平台而非竞赛题目;社区建议转向 picoGym、HackTheBox 等实验环境保持技能传承;排名榜被 AI 主导后,传统 CTF 形式已难以维持其原有意义。 Ploopy Bean: a trackpoint for every computer 核心亮点 开源 3D 打印指点杆,售价 69.99 加元,出厂即可使用。 关键特性 四个 Omron D2LS‑21 按钮,内置 QMK firmware 支持 VIA 自定义;预订分 Early Access、Tier A(8 周)和 Tier B(20 周)三批;包含黑色顶底件、弹簧、PCB、线缆、螺丝、磁铁、摩擦垫等配件;重量 0.052 kg,尺寸 8.4 × 6.4 × 1.6 cm。 实际影响 为任意笔记本或台式机增添高精度指点设备,降低使用门槛;开源固件便于社区自行修改功能映射。 The bird eye was pushed to an evolutionary extreme 研究发现 鸟类内部视网膜无血管、不使用氧气产生能量,依赖无氧糖酵解供给 ATP;其葡萄糖消耗量是同样大小脑组织的 2.5 倍。 方法简介 使用微传感器在斑马雀、鸽子和鸡眼中测氧,确认内部视网膜缺氧;空间转录组分析显示色素层表达有氧呼吸基因,而内层仅表达无氧基因。 意义与局限 特殊结构肌纹 oculi 富含葡萄糖转运和乳酸排出蛋白,解释了如何维持无氧糖酵解;该适应可能源自兽脚类恐龙,有助于解释鸟类高分辨率视觉;目前尚未证实所有鸟种(尤其是迁徙种)共享相同机制。 Naturally Occurring Quasicrystals 研究发现 在极端高能事件中发现自然准晶体:陨石中出现二十面体 Al₆₃Cu₂₄Fe₁₃、十堆垛 Al₇₁Ni₂₄Fe₅、十二折对称的闪电玻璃核以及原子弹测试点的硅富集二十面体。 方法简介 这些样品形成于小行星撞击、雷击熔融砂或核爆瞬间的高温快速冷却过程,原子在非平衡条件下自组装成无周期但有序排列。 意义与局限 表明自然界能在极端条件下自发形成准晶体结构;但此类样品极其罕见,绝大多数已知准晶体仍需实验室合成;社区指出十二折对称在合成样本中已知,稀有性可能受观测限制。 The main thing about P2P meth is that there's so much of it (2021) 事件概述 P2P 路线制备的甲基苯丙胺产量激增,纯度提升至约 95% d‑异构体。 背景脉络 2009‑2012 年因伪麻黄碱禁令,美国与墨西哥转向苯基丙酮前体;早期产物含相当比例的 l‑异构体,后期通过工艺改进实现高纯度 d‑甲基苯丙胺。 行业影响 价格从 2014 年约 15 k 美元/磅降至 2019‑2020 年的 4‑5 k 美元/磅;供应充盈导致日均使用者比例上升,过量死亡随之增长;由于纯度提升,致幻和社会问题主要由用量增加驱动,而非杂质或 l‑异构体。 Moving away from Tailwind, and learning to structure my CSS 问题背景 早期依赖 Tailwind 导致样式文件体积大、缺乏底层 CSS 理解、混用原生类与实用类难以维护。 解决方案 迁移到语义化 HTML + 原生 CSS,保留 Tailwind 的重置(preflight)、颜色变量、字体大小变量;采用组件划分、网格布局(auto‑fit)以及 owl 选择器管理间距;使用 esbuild 进行静态打包。 应用场景 适用于小型站点、需要精细控制布局的项目,以及想探索 @layer、@scope、容器查询等新特性的前端开发。 Additive Blending on the Nintendo 64 问题背景 N64 原生 16 位帧缓冲在进行加法混合时会出现颜色包绕,导致爆炸等效果失真。 解决方案 在 32 位离线缓冲中以 1/8 强度绘制所有加法精灵;利用 RSP 颜色变换把颜色压回 5 位范围,实现无包绕的加法效果;整帧转换时间由 70 ms 降至约 3 ms。 应用场景 适用于需要爆炸、等离子体或法术光效的 N64 游戏或演示,可在现有开发工具链(libdragon、RSPL)中直接采用。 Δ‑mem: Efficient Online Memory for Large Language Models 研究发现 在冻结的全注意力骨干上增添 8×8 在线关联记忆矩阵,通过增量学习更新状态;生成时记忆读出产生低秩修正,直接调整注意力计算。 方法简介 使用 delta‑rule 学习规则更新记忆矩阵;低秩读出与注意力得分相加,形成对键值对的修正;整体仅需额外的 8×8 参数。 意义与局限 在 MemoryAgentBench、LoCoMo 等记忆密集基准上使得分提升 1.2‑1.3 倍,且基础语言能力基本未受影响;表明紧凑在线状态可在不全量微调或扩展上下文的情况下有效提升模型记忆。 SANA-WM, a 2.6B open-source world model for 1-minute 720p video 项目定位 2.6B 参数开源世界模型,能够根据单张图像和相机轨迹生成可控 720p、分钟级视频,单块 H100 GPU 即可推理。 核心能力 混合线性注意力:帧级 Gated DeltaNet 与周期性 softmax 结合,显著降低显存占用;双分支相机控制:粗粒度全局姿态与细粒度像素对齐几何协同,实现精准 6‑DoF 轨迹跟随;两阶段生成流程:第一阶段生成视频骨干,第二阶段使用 17B 参数细化网络提升纹理与运动;稳健标注流程:从公开视频提取度量级 6‑DoF 相机姿态作为训练标签。 使用场景 单 GPU 上生成一分钟 720p 视频,适用于虚拟制作、内容创作或科研仿真;蒸馏版本在 RTX 5090 上采用 NVFP4 量化可在 34 秒完成去噪生成同长度视频。 Fecal transplants for autism deliver success in clinical trials (2019) 事件概述 粪菌移植在自闭症儿童中显著改善行为症状,随访两年症状减少近半。 背景脉络 自闭症伴发胃肠问题率约 30‑50%,菌群多样性偏低;早期研究显示八周内行为改善,后续观察显示持续提升。 行业影响 后续进入 II 期双盲安慰剂对照试验,结果显著;研究团队已申请专利并成立公司推进 III 期试验,争取 FDA 批准;社区对 “受害者” 用词有争议,强调自闭症为神经差异而非疾病,倡导使用中性描述。 相关链接: * Frontier AI has broken the open CTF format * Ploopy Bean: a trackpoint for every computer * The bird eye was pushed to an evolutionary extreme * Naturally Occurring Quasicrystals * The main thing about P2P meth is that there's so much of it (2021) * Moving away from Tailwind, and learning to structure my CSS * Additive Blending on the Nintendo 64 * Δ-Mem: Efficient Online Memory for Large Language Models * SANA-WM, a 2.6B open-source world model for 1-minute 720p video * Fecal transplants for autism deliver success in clinical trials (2019)
260511|Gmail 注册需扫码,毒素辣椒杀耐药Ratty – 终端内嵌 3D 图形 核心亮点 Ratty 是一个 GPU 渲染的终端仿真器,能够在终端文本流中直接绘制内联 3D 图形。默认带有旋转的老鼠光标。 关键特性 * 使用 GPU 进行光线追踪或光栅化,摆脱传统字符网格限制。 * 支持常见的 ANSI 转义序列,兼容现有 shell 工作流。 * 提供可配置的光标主题和颜色方案。 实际影响 开发者可以在终端中展示体积数据、简单的游戏原型或教学演示,而无需额外图形窗口。项目已经在 GitHub 开放源代码,社区成员报告在低端笔记本上也能保持 30 FPS 的渲染速度。 我决定再次手写代码 核心观点 依赖 AI 只生成特征而不进行架构设计会导致代码结构腐化,最终抵消任何速度提升。 论证逻辑 * 作者在七个月的 vibe‑coding 过程中,让 Claude 不断堆砌特征,最终出现单一巨型结构体(god object),其中 UI、Kubernetes 客户端、日志、舰队视图等所有状态混杂。 * 由于缺少视图隔离,资源加载处理器中出现大量手动 = nil 语句,遗漏任意一条都会导致脏数据泄漏。 * 按键处理和并发更新也把所有逻辑塞进一个 500 行的 Update 函数,造成难以维护的分支和潜在的数据竞争。 * 作者提炼出五条准则:先写架构、避免全局状态、限制范围、使用类型化数据、把所有状态变更限制在主事件循环。 延伸思考 团队可以在 CLAUDE.md 或类似文件中写下架构不变量、状态所有权规则和范围声明,让 AI 在每次提示时看到这些约束,从而把“偷懒的路径”变成“正确的路径”。手写架构文档不是多余的步骤,而是防止技术债务爆炸的必要条件。 在搭载 24 GB 内存的 M4 上运行本地模型 问题背景 用户希望在离线环境中使用大语言模型进行编码、研究和计划,同时不想依赖付费的云服务或牺牲太多系统资源。 解决方案 * 选取 Qwen 3.5‑9B Q4_K_S(约 5 GB),在 LM Studio 中启用思考模式,设置 temperature=0.6、top_p=0.95、top_k=20、min_p=0.0。 * 通过 pi 或 OpenCode 将模型作为本地后端接入,分别提供简洁的配置文件和工具调用支持。 * 该配置在 24 GB MacBook Pro 上实现约 40 token/s 的生成速度,留出足够内存供其他 Electron 应用使用。 应用场景 * 快速检查代码风格、生成样板或重构建议(如更新 Credo 规则)。 * 作为橡皮鸭进行问题拆解和步骤验证。 * 处理依赖冲突、生成提交信息或编写简单的脚本,全部在不联网的情况下完成。 Gmail 注册现在需要扫码并发送短信 事件概述 Google 账户注册流程改为:用户先在手机上扫描屏幕上的 QR 码,随后向 Google 发送一条包含验证码的短信(出站 SMS),而不再是接收验证码。 背景脉络 此举旨在提升注册安全,使得批量注册或使用临时号码服务(如 SMSpool)变得更困难,因为攻击者必须控制能够发送付费短信的真实设备。 行业影响 * 用户可能产生运营商计费的短信费用,匿名注册路径被封闭。 * 隐私倡导者担心该要求排除了没有移动计划或依赖虚拟号码进行 KYC 的人群。 * 社区讨论中有人建议使用专用 SIM 卡或接受费用,也有人希望 Google 未来提供替代验证方式。 AI 编码代理必须降低维护成本 核心观点 仅靠 AI 提升代码产出而不同时削减维护负担,最终会导致长期生产力下降。 论证逻辑 * 作者引用“众智法”调研:编码后第一年需花 10 天维护,之后每年 5 天。 * 如果产出翻倍而维护成本不变,维护负担实际上也翻倍;若产出和维护成本均翻倍,总负担变为四倍。 * 图表显示,在维护成本不变的情况下,价值创造时间从 100 % 降至约 65 %(第一年),十年后降至约 12.5 %;维护成本减半可将 50 % 产出点推迟至约 68 个月,反之则仅 10 个月即跌破 50 %。 * 因此,AI 带来的速度提升必须与维护成本的降低成反比(产出×2 → 维护÷2),否则只是用暂时的加速换取永久的生产力下降。 延伸思考 要真正受益于 AI,除了提升生成速度,还应让 AI 本身变得更易于维护:生成结构清晰、类型化的代码;提供自动重构或依赖升级建议;或直接用于现有代码库的维护任务(如错误修复、文档生成)。只关注产出而忽略维护的策略会在几个月后适得其反。 Mothos 在 curl 源码中发现漏洞 研究发现 Anthropic 的大语言模型 Mythos 对 curl 代码进行静态扫描,最初标记五处“已确认”漏洞,经 curl 安全团队复核后仅剩一处低危 CVE(将在 8.21.0 版本公布),其余四项被判定为三个假阳性和一个普通错误。 方法简介 * 扫描使用了 Mythos 模型,结合传统静态分析、编译器警告以及多年模糊测试(OSS‑Fuzz、Coverity 等)。 * 模型能够注释与代码不一致、检查难以运行的平台、理解第三方库 API、总结漏洞并给出可用补丁(尽管往往不是完整修复)。 意义与局限 * 结果表明 AI 驱动的代码分析器在补充人工审查方面具有价值,尤其对尚未采用此类工具的项目。 * 然而,此次扫描并未发现全新漏洞类别,主要是以更高效率重新发现已知错误的新实例,仍需人工专家验证和修复。 * 社区建议将类似检查扩展到 curl 所依赖的其他库(如 nghttp2、OpenSSL),并公开 token 使用成本,以便其他项目评估成本效益。 相关链接: * Ratty – A terminal emulator with inline 3D graphics * I'm going back to writing code by hand * Running local models on an M4 with 24GB memory * The greatest shot in television: James Burke had one chance to nail this scene (2024) * Gmail registration now requires scanning a QR code and sending a text message * Guy Goma's Accidental BBC Interview Lives on After 20 Years * An AI coding agent, used to write code, needs to reduce your maintenance costs * Mythos Finds a Curl Vulnerability * Guitar tuner that uses phone accelerometer * Venom and hot peppers offer a key to killing resistant bacteria
260509|光合藻类发光,闪电成因探秘A recent experience with ChatGPT 5.5 Pro 数学成果 ChatGPT 5.5 Pro 在大约一小时内生成了关于 h‑fold sumset 的 PhD 级笔记,改进了已知上界。模型先给出 h=2 情况的二次上界,随后推广到任意 h,得到多项式界 (N(h,k)\le O(k^{10h^{3}}))。 关键思想 它构造了 (h^{2})-dissociated 集合,利用“半几何级数”组合算术 progression 和额外点,使得所需直径仅随 k 的某个幂增长。 社区反应 评论指出,此类 AI 生成结果可能改变数学评价标准——证明 LLMs 无法完成的内容或与它们协作将成为新的贡献门槛。也有人警告模型使用费用可能加剧研究不平等,而另一些则认为引导 AI 的技巧将成为更有价值的技能。 OpenAI’s WebRTC Problem 核心观点 作者认为 WebRTC 不适用于语音 AI,因为其设计目标是低延迟实时通话,而在语音 AI 场景中宁愿牺牲一点延迟以获得完整的音频。 论证逻辑 * WebRTC 在恶劣网络下会激进丢包,导致提示音频损毁;而语音 AI 用户更希望缓冲以保证提示正确性。 * 协议要求源 IP/端口不变,实际移动网络频繁变动导致连接中断,必须额外插入人工延迟或使用复杂的负载均衡 hack。 * 建立连接需多达 8 次往返,远超基于 QUIC 或 WebSocket 的方案。 延伸思考 文章提出使用 WebSocket 或 QUIC(结合 WebTransport)可以复用现有 TCP/HTTP 基础设施,实现零状态负载均衡和任意播放缓冲,从而同时提升音频质量和系统可伸缩性。 Wi is Fi: Understanding Wi-Fi 4/5/6/6E/7/8 (802.11 n/AC/ax/be/bn) 问题背景 很多用户认为路由器决定最高速度,但实际上终端设备的空间流数和通道宽度才是瓶颈。 关键特性 * 终端常为 2×2 MIMO,Wi‑Fi 5 最高 PHY 约 866 Mbps,实际吞吐约 650 Mbps。 * 路由器通过聚合多频段理论峰值来夸大宣传速度,而设备同一时间只能使用一个频段。 * 要达到 Gbps 需要终端支持 160 MHz 或更宽通道、高阶 QAM(如 Wi‑Fi 6 的 1024‑QAM、Wi‑Fi 7 的 4096‑QAM)以及靠近 AP 的强信号。 应用场景 若终端能力受限,升级路由器效果有限;更有效的做法是使用有线回程(Ethernet、MoCA 或 Powerline)或在需要的位置部署有线接入点,避免无线中继导致的带宽减半。 Mythical Man Month 核心观点 《人月神话》指出,向延期项目加人会使其更晚,根本原因是沟通路径随人数呈指数增长。 论证逻辑 * 沟通开销主导项目进度,除非架构能够有效分割任务。 * 作者强调概念完整性:一个体系若保持单一设计思想,即使舍弃一些特性也比堆砌不协调的功能更具价值。 * 附带的 “没有银弹” 论文再次提醒没有单一技术能根本解决软件复杂度。 延伸思考 如今的微服务和 DevOps 实践仍在围绕如何降低跨团队沟通成本进行探索,而概念完整性则提醒架构师在追求新特性时保持整体结构的一致性。 The React2Shell Story 事件概述 2025 年底,研究人员在 Next.js 的 React Server Components 中发现 RCE 漏洞(CVE‑2025‑55182),攻击者可通过恶意 Flight 消息在服务器端执行任意 JavaScript。 背景脉络 * Flight 协议用于在客户端与服务器之间传输非 JSON 类型(如 Date、Promise、引用等),但未对继承属性进行安全过滤。 * 攻击链利用 TypeScript 只在编辑时检查类型的特点,将恶意对象传入期望字符串的参数,进而劫持 toString、replaceAll 等方法,最终通过 Module._load 实现代码执行。 行业影响 漏洞披露后,Meta、Vercel 与 React 团队在 17 小时内完成修复并发布公告。事件提醒开发者即使使用类型系统也需在运行时验证不可信数据,并且服务器端渲染框架的内部协议同样需要安全审计。 Using Claude Code: The unreasonable effectiveness of HTML 项目定位 该文章展示了 Claude Code 在处理 HTML 时的意外高效表现——即使模型未专门针对网页语法训练,也能生成可用的结构化标记。 核心能力 * 能够从自然语言描述推断出合适的标签层次与属性。 * 在少量示例下即可完成表单、表格以及嵌套结构的生成。 使用场景 适用于快速原型页面、文档转化或需要将描述性需求直接转为 HTML 的场景,降低前端工程师的手写成本。 Can LLMs model real-world systems in TLA+? 研究发现 在 SysMoBench 基准测试中,领先的 LLMs 在语法和基本运行阶段表现良好(近 100% 通过),但在一致性与不变量验证阶段平均仅约 46% 和 41%,表明模型易产生“教科书式”规范而未捕捉实际系统细节。 方法简介 评估分为四阶段:语法检查、TLC 执行、轨迹一致性验证(Transition Validation)以及不变量验证。一致性阶段通过把真实系统的执行轨迹切换为状态‑动作‑状态三元组,检查规范是否能够复现每一步。 意义与局限 结果说明仅依赖语法正确无法保证模型真正理解系统行为;亟需改进 trace 抽象与状态表示方法,才能让 LLM 生成可用于形式验证的精确模型。 Light without electricity? Glowing algae could make it possible 核心亮点 研究人员利用酸性或碱性溶液让海洋藻类 Pyrocystis lunula 持续发光,酸性条件下可维持 25 分钟亮度,并在水凝胶中存活数周。 关键特性 * 藻类在酸(pH ≈ 4)或碱(pH ≈ 10)溶液中均能触发发光,酸性更持久且光更集中。 * 将活藻封入天然水凝胶后,可通过 3D 打印制作任意形状,发光整体均匀。 * 藻类通过光合作用固定海溶性二氧化碳,发光过程实际上是在存储碳的同时释放光子。 应用场景 该活体光材料可用于深海或太空探索机器人的无电照明,亦可作为水质传感器——毒素存在时改变发光强度。 What causes lightning? The answer keeps getting more interesting 事件概述 传统认为雷击需电场强度超过气体击穿阈值(约 3 MV/m),但实际云中场强远低于此值,科学家提出多种补强机制。 背景脉络 * 早期假设依赖冰晶放大局部场,但观测显示冰晶不够锐利。 * 1994 年卫星捕捉到伽马射线闪现,促使 relativistic runaway electron avalanche(RREA)模型被提出,说明高能电子级联可产生所需辐射并进一步增强场强。 * 近年来的高空飞行实验(ALOFT)在无可见闪电时检测到伽马射线余光,支持 RREA 在真实雷云中发生。 行业影响 科学家如今认为雷电形成可能是冰晶场强、relativistic avalanche 以及宇宙射线诱导电离三种过程的混合,不同风暴可能主导不同机制。未来需同步测量伽马射线与无线电爆射以区分主导过程。 Internet Archive Switzerland 项目定位 Internet Archive Switzerland 是一家瑞士非营利基金会,致力于普惠知识的长期保存,尤其关注人工智能模型与濒危档案的数字化。 核心能力 * 与圣加仑大学合作建立 Gen AI Archive,收集当代有影响力的生成式模型和大型语言模型的源码及权重。 * 通过 UNESCO 支持的 Endangered Archives 项目,把面临战争、灾难或压迫的档案数字化并存放于安全服务器。 使用场景 研究人员可从此 AI Archive 获取历史版本的模型以进行可重复性实验;档案保存团队则利用其基础设施救助危机地区的文献、照片及音像资料,确保在格式老化或媒体损坏后仍能访问。 相关链接: * A recent experience with ChatGPT 5.5 Pro * OpenAI’s WebRTC problem * Wi is Fi: Understanding Wi-Fi 4/5/6/6E/7/8 (802.11 n/AC/ax/be/bn) * Mythical Man Month * The React2Shell Story * Using Claude Code: The unreasonable effectiveness of HTML * Can LLMs model real-world systems in TLA+? * Light without electricity? Glowing algae could make it possible * What causes lightning? The answer keeps getting more interesting * Internet Archive Switzerland
260507|入LOC标准,石油期货内幕今日精选涵盖事件、可持续计算、存储标准、网络启动、语言模型基准与开源硬件。 The map that keeps Burning Man honest 事件概述 每年黑岩城清理后,志愿者会绘制 MOOP 地图,标记废弃物分布与清理难度。 背景脉络 地图颜色表示废弃物严重程度,黄色为中度,红色为重度,以帮助满足土地管理局每英亩不超过一平方英尺废弃物的标准。 行业影响 通过公开个人营地的废弃物数据,地图促使参与者改进留痕原则,近十年人均废弃物呈下降趋势。 Permacomputing Principles 核心观点 将永续农业伦理应用于数字技术,提出十条指导原则以减少硬件浪费和能源消耗。 论证逻辑 每条原则从问题背景给出可操作步骤,例如延长硬件寿命、观察需求后再采取行动、公开能源使用等,旨在抵消效率提升导致的使用增长。 延伸思考 这些原则不作为严格规定,而是工具,帮助个人和组织在设计、采购和使用计算设备时考虑生态与社会影响。 SQLite Is a Library of Congress Recommended Storage Format 核心亮点 美国国会图书馆将 SQLite 列为推荐存储格式, alongside XML、JSON、CSV。 关键特性 SQLite 为单文件、自包含,具备公开规范、广泛采用、可读取的 schema、内嵌元数据、极少外部依赖且无专利限制。 实际影响 这意味着档案机构可更有信心使用 SQLite 保存长期数据集,期望其在未来环境中仍能可靠读取。 Diskless Linux boot using ZFS, iSCSI and PXE 问题背景 作者希望在不修改本地 Windows 分装的情况下,运行基于 Debian 的开发环境,避免频繁的 USB 或分区操作。 解决方案 利用 PXE 引导 Netboot.xyz,通过 iSCSI 连接到运行 ZFS ZVol 的远程块设备,安装 Debian 后直接从 SAN 启动。 应用场景 此方案适用于需要隔离实验系统、保持主机不变或在多台机器间快速切换相同环境的开发者和实验室。 ProgramBench: Can language models rebuild programs from scratch? 研究发现 在 200 项任务中,九种语言模型均未完全完成任何基准,表现最好的仅在 3% 任务上通过 95% 测试。 方法简介 基准采用代理驱动的模糊测试生成端到端行为用例,模型需自行设计架构并实现代码,使其行为与参考可执行文件匹配。 意义与局限 结果表明当前模型倾向生成单文件单体代码,缺乏模块化结构,显示在无显式指导下进行高层次软件设计仍然不足。 Community firmware for the Xteink X4 e-paper reader 项目定位 CrossPoint Reader 为 Xteink X4 电子纸阅读器提供完全开源的固件,旨在替代官方封闭版本。 核心能力 固件基于 ESP32‑C3,支持 EPUB 2/3 解析与渲染、图像显示、读书进度缓存、Wi‑Fi 书籍上传及 OTA 更新,并提供可自定义字体、布局和屏幕旋转。 使用场景 适合希望在低成本硬件上获得可定制阅读体验的用户,尤其需要长时间阅读、离线缓存或跨设备同步阅读进度的场景。 相关链接: * The map that keeps Burning Man honest * Permacomputing Principles * SQLite Is a Library of Congress Recommended Storage Format * Diskless Linux boot using ZFS, iSCSI and PXE * Grand Theft Oil Futures: Insider traders keep making a killing at our expense * Boris Cherny: TI-83 Plus Basic Programming Tutorial (2004) * ProgramBench: Can language models rebuild programs from scratch? * RSS feeds send me more traffic than Google * Community firmware for the Xteink X4 e-paper reader * Building my own Vi text editor in BASIC
260504|让我们买精神航空,欧盟手机可拆电池今日 Hacker News 精选涵盖技术标准、跨平台兼容、存储硬件探测及欧盟新规四个方向。 Introduction to Atom Atom馈送的基本结构 一个馈送由元数据和任意数量的条目组成。必需元素包括 id、title 和 updated,其中 id 采用永久唯一 URI,title 为人类可读标题,updated 遵循 RFC 3339 表示上次实质性修改时间。 常见馈送元素 推荐使用 author、link(特别是指向自身的 self 链接),可选元素有 category、contributor、generator、icon、logo、rights 和 subtitle,分别用于标记类别、贡献者、生成软件、视觉标识、版权信息和副标题。 条目(entry)的元素 条目同样需要 id、title 和 updated。推荐元素包括 author、content 或 summary、link,其中 content 提供完整正文,summary 提供简短摘录。可选元素有 category、contributor、published、rights 和 source(当条目是其他馈送的副本时)。 常见构造与扩展 category 必须包含 term 属性,可选 scheme 和 label。content 的 type 属性决定编码方式:纯文本、实体转义的 HTML、内联 XHTML、内联 XML 或 Base64。link 类似 HTML 的 link 元素,必需 href,可选 rel、type、hreflang、title、length。作者和贡献者通过 <name> 必须提供,可选 <uri> 和 <email>。Atom 设计允许在任意位置加入其他命名空间的元素,因而多数 RSS 模块可直接复用。 Tar Files Created on macOS Display Errors When Extracting on Linux (2024) 产生原因 macOS 默认使用 BSD tar(bsdtar),会将扩展属性和 AppleDouble 文件打入存档。Linux 上的 GNU tar 无法识别这些 macOS 专属扩展头关键字,因而提示 “Ignoring unknown extended header keyword” 并在解压时生成 ._ 前缀的占位文件。 解决方案 * 禁用扩展属性:在创建命令中加入 --no-xattrs,如 tar -cvzf --no-xattrs pix.tar.gz pix,防止额外属性写入。 * 禁用 copyfile(AppleDouble):使用 --disable-copyfile,同样可避免 ._ 文件产生。 * 改用 GNU tar:通过 Homebrew 安装 gnu-tar 并将其目录加入 PATH,使后续 tar 调用默认生成兼容的存档。 结论 任一方法均可去除多余的 ._ 文件和警告信息。基于标记的快速修改适合临时需求,安装 GNU tar 提供永久透明的解决方案。 Discovering hard disk physical geometry through microbenchmarking (2019) 研究发现 通过禁用缓存并测量同一扇区连续读取的时间可得转速(RPM);不同扇区读取时间减去整圈转数得到扇区角位置。由此可追踪轨道边界(通过角度突变点),计算每道扇区数、寻道时间以及盘片数量。在 45 MB 至 5 TB 的 17 款硬盘上观察到: * 全行程访问时间需 1.3–3.6 圈磁盘转动; * 轨道偏斜(轨道起始角度偏移)占一圈的 6%–36%,意味着顺序读取有 74%–94% 时间用于数据传输; * 平均轨道间距从早期约 40 µm 缩至现代约 80 nm(每英寸轨道数约 650–310 000),对应比特长从约 2.6 µm 降至约 17 nm; * 轨道布局分为“头先”(老款)和“寻道先”(新款)两类,后者反映头切换成本升高; * 通过轨道大小和寻道模式的变化推断盘片数量,例如 Toshiba X300 有 10 片,Seagate 15K.7 有 6 片,多数消费级硬盘为 2–6 片; * 坏道表现为角位置图上的空洞,局部轨道滑移导致异小的蛇形群组和非对称寻道曲线。 方法简介 作者构建微基准,逐个读取扇区并用高精度计时器记录间隔;通过多次采样并剔除整圈转数得到角位置;再利用聚类或阈值检测轨道跳变;最后在全盘遍历中拼合得到完整几何模型。 意义与局限 该方法无需拆盘即可获取物理结构,适用于固件验证、数据恢复或性能调优。局限在于:部分旧硬盘的步进电机无法认为轨道偏斜为零;若缓存无法关闭,需采用交替读取规避;寻道时间的非线性特征增加了边界自动检测的难度。 社区反馈 读者询问基准是否加速磨损,作者称在正常数据上运行数天仅见一已故障微型硬盘异常。还有人询问绘图工具(使用 Python+Matplotlib)、许可证(按学术论文自由引用)以及自动扇区范围的处理(代码已将 −1 视为磁盘大小后截取)。有人建议加入 SMR 检测或移植到 Windows,作者指出 SMR 需要写入操作,Windows 移植则需原始扇区读取和缓存禁用的实现。 Removable batteries in smartphones will be mandatory in the EU starting in 2027 事件概述 欧盟将从 2027 年 2 月 18 日起强制新售智能手机和平板电池可由用户自行拆卸更换,禁止仅靠热溶剂粘合的固定方式。 背景脉络 该规定服务于欧盟循环经济目标:通过可替换电池延长设备寿命,减少电子废弃物;提高锂、钴等贵金属回收率;降低因粘合电池在破碎时引起的起火风险;同时为用户提供更换成本更低的维修选择。 行业影响 制造商需重新设计内部结构,例如使用螺丝固定或卡扣结合硅胶垫实现防水防尘;若需专用工具则须免费提供;替换电池须在五年内以合理价格供应。长期来看,用户可自行更换电池以节省维修费用,二手机因电池新旧可获更高转售价,同时厂商面临提供更长周期安全更新的压力。 (其余标题仅作列出,因缺少正文或评论,未在本文中展开) 相关链接: * Using “underdrawings” for accurate text and numbers * Let's Buy Spirit Air * GameStop makes $55.5B takeover offer for eBay * Talking to strangers at the gym * Trademark violation: Fake Notepad++ for Mac * Introduction to Atom * Tar Files Created on macOS Display Errors When Extracting on Linux (2024) * Discovering hard disk physical geometry through microbenchmarking (2019) * The 'Hidden' Costs of Great Abstractions * Removable batteries in smartphones will be mandatory in the EU starting in 2027
260503|Kimi夺冠编程,奔驰回归实体按钮今日精选聚焦汽车交互与前端AI推理两个方向 Mercedes‑Benz 宣布恢复实体按钮 事件概述 Mercedes‑Benz 表示将在未来车型中重新加入传统机械按钮,以取代部分触控屏功能。 背景脉络 近年来,车内触控屏普及导致一些驾驶者反馈操作缺乏触感、视线分散。该公司通过用户调研发现,机械按钮在调节空调、音量等频繁使用场景中更受欢迎。 行业影响 该决定可能促使其他豪华车品牌重新评估触控屏与实体控制的比例。供应链方面,按钮模块需求短期内将有所上升,而纯触控方案的研发投入可能趋于平缓。 Show HN: Apple SHARP 在浏览器中运行 问题背景 将大型语音转文本模型部署到服务器端会增加延迟和隐私风险,尤其在需要即时转写的场景中。 解决方案 利用 ONNX Runtime Web,将 Apple 的 SHARP 模型编译为 WebAssembly,实现完全在浏览器内的客户端推理。模型在加载后即可进行实时语音识别,无需后端交互。 应用场景 适用于对隐私敏感的记事应用、现场会议字幕以及离线环境下的语音输入。开发者可通过量化或裁剪降低模型体积,以缓慢网络上的初始加载时间;对于长音频,则建议采用分块处理或利用运行时的流式支持。 相关链接: * A couple million lines of Haskell: Production engineering at Mercury * This Month in Ladybird – April 2026 * Mercedes-Benz commits to bringing back physical buttons * Kimi K2.6 just beat Claude, GPT-5.5, and Gemini in a coding challenge * Show HN: Apple's SHARP running in the browser via ONNX runtime web * Specsmaxxing – On overcoming AI psychosis, and why I write specs in YAML * Windows quality update: Progress we've made since March * Group averages obscure how an individual's brain controls behavior: study * Care homes and hotels in Japan shut as expansion strategy unravels * A desktop made for one
260430|比利时核电不退役,文特尔去世今日精选:纪念基因组学先驱Craig Venter,IBM发布开源Granite 4.1模型系列,以及用数学视角重新审视细胞内部结构的散文。 Craig Venter 逝世 讣告与生平 Craig Venter 在 2026 年 4 月 30 日去世,享年 79 岁。他曾领导私营部门的人类基因组计划,并在 2010 年创造了第一个合成生物体。 科学贡献 他推动了高通量基因测序技术的商业化,使得个体基因组测序成本大幅下降。此外,他创立的 JCVI 负责多个宏基因组和微生物组项目,为环境DNA研究提供了数据基础。 社区反馈与影响 在 Hacker News 的讨论中,一些读者指出他的基因专利策略引发过争议,但多数同意他的工作为合成生物学和个性化医疗奠定了技术基础。还有人提到他晚年转向衰老和微生物组研究,试图利用基因技术延缓衰老。 Granite 4.1: IBM 发布 8B 模型,性能匹配 32B MoE 核心亮点 IBM 发布 Granite 4.1 系列,包含 3B、8B、30B 参数的密集 Transformer 模型,采用 Apache 2.0 许可。8B 指令模型在 ArenaHard 基准上得到 69.0 分,超过了之前 32B 混合专家模型(仅 9B 活跃参数)的分数。 关键特性 * 训练数据共 15 万亿 token,分五阶段进行,数据说例从 CommonCrawl 逐步转向代码、数学和链式思路。 * 使用 LLM‑as‑Judge 过滤低质量样本,得到 410 万条微调数据;随后进行四阶段强化学习,涵盖多领域、RLHF、身份校准和专项数学强化。 * 上下文窗口扩展至 512K token,且通过逐阶段扩展与权重合并保持短文本表现。 实际影响 基准测试显示,8B 在 BFCL V3(工具调用)达 68.3,超过同尺寸的 Qwen3‑8B;在 GSM8K 数学推理上达 92.5,接近 30B 水平。FP8 量化版本可显著降低显存占用,适合在消费级 GPU 或专用机器上部署。开发者在 Hacker News 中指出,该模型的工具调用能力和明确许可证使其成为企业内部代理的有力选择。 Biology is a Burrito:用数量化视角理解细胞内部 核心观点 作者 Niko McCarty 将细胞比作馅料紧密卷裹的卷饼,强调细胞内部极度拥挤,宏观分子以极高浓度相互碰撞。 论证逻辑 * 以大肠杆菌为例,其基因组若拉伸长度约 0.17 厘米,相当于细胞长度的 1000 倍;约 5 亿个基因组首尾相连可达到月球并返回数次。 * 细胞干重约 300 飞克,其中水占 70%;蛋白质占干重的 50%、RNA 20%、脂质 10%、DNA 仅 1%。如此高浓度使得蛋白质在细胞内的平均自由程仅几微米,而小离子可在一秒内穿越万倍细胞长度。 * 转录与翻译速度极快:RNA 聚合酶每秒合成约 40 核苷酸,错误率约 10⁻⁵;核糖体约 24 秒完成一条平均蛋白质的合成。 * 通过随机走模型展示扩散限制:蛋白质在细胞内的均方位移需数十毫秒,而在水中移动一厘米则需数十天,说明细胞尺寸受扩散约束。 延伸思考 文章指出,仅凭静态结构图无法捕捉这种动态拥挤;理解生命需要结合数学模型与实验测量。作者建议生物教育应加入定量思维,利用简单的笔算推导细胞内部过程,以培养对“噪声中信息”的直觉。在 Hacker News 讨论里,读者称此文让他们首次感受到“蛋白质在细胞里像在拥挤的地铁站里奔跑”,并提出可用于教学的互动模拟。 相关链接: * Where the goblins came from * Belgium stops decommissioning nuclear power plants * Cursor Camp * The Zig project's rationale for their anti-AI contribution policy * Noctua releases official 3D CAD models for its cooling fans * Claude Code refuses requests or charges extra if your commits mention "OpenClaw" * Mozilla's opposition to Chrome's Prompt API * Craig Venter has died * Granite 4.1: IBM's 8B Model Matching 32B MoE * Biology is a Burrito: A text- and visual-based journey through a living cell
260427|AI解埃尔迪猜想,美国地热突破今日 Hacker News 精选:从软件人才危机到 AI 辅助数学证明,再到隐私过滤、地热能突破与开源项目进展。 The West forgot how to make things, now it’s forgetting how to code 人才管道断裂 文章讲述美国国防工业因长期和平红利导致人才流失,Stinger 导弹生产线因关键工程师退休而被迫停摆,类比软件行业对 AI 的依赖正在侵蚀深层工程能力。 AI 带来的误解 开发者普遍相信 AI 能提高效率,但 METR 随机对照试验显示,有经验的工程师使用 AI 编码实际用时比不使用增长 19%,而他们预期提升 24%,期望与实际相差 43 个百分点。许多工程师在后续实验中拒绝离开 AI,表明对工具的依赖已经形成心理惯性。 对策与思考 作者通过修改 PR 模板、强制增加变更说明和截图,并为每个项目配备专职审核员来捕捉模型盲点。评论中有人指出,「Well it’s not like software is critical for modern infrastructure……」,提醒技术决策者不要被营销掩盖的人才短fall。真正的工程素质在于判断力和沟通能力,这些正是目前市场稀缺的能力。 Amateur armed with ChatGPT solves an Erdős problem 事件概述 23 岁业余爱好者 Liam Price 在一次闲散的下午将 Erdős 原始集合下界问题输入 ChatGPT,模型给出了一个看似正确的证明。 背景脉络 该猜想由 Erdős 于 1960 年代提出,涉及无整除关系的整数集合的得分上限。此前仅在素数集合上得到上限 1.6 的证明,下界长期悬而未决。Price 将模型输出发给剑桥二年级学生 Kevin Barreto 共同检查,Barreto 发现方法与以往尝试完全不同,使用了在相关数学领域已知但未用于此类问题的公式。 行业影响 Terence Tao 和 Jared Lichtman 在提炼后确认该思路新颖且具备推广潜力。证明已发布在 erdosproblems.com,社区普遍认为 AI 能提供全新视角,但也警告不要把单一成功过度解读为 AI 数学能力的全面突破。 OpenAI Privacy Filter 核心亮点 OpenAI 发布 Privacy Filter,一个开放权重的 1.5B 参数双向 token 分类模型,专用于检测和遮蔽文本中的个人身份信息(PII)。 关键特性 * 支持上下文感知的八类 PII 检测(姓名、地址、邮箱、电话、URL、日期、账号、密钥),采用 BIOES 标签产生连贯遮蔽区块。 * 单向前向传播即可完成标注,支持最高 128k tokens 的长文本,可在本地运行以降低数据外泄风险。 * 在 PII‑Masking‑300k 基准上达到 97.43% F1(修正后),少量领域微调即可将 F1 从 54% 提升至 96%。 实际影响 开发者可在训练、索引、日志和审核管道中直接调用该模型,实现数据离机的隐私保护。OpenAI 已在内部工作流中使用其微调版本,并计划在 Hugging Face 与 GitHub 上提供 Apache 2.0 许可证的版本,供实验、定制和商业部署。 America's Geothermal Breakthrough 事件概述 美国增强型地热系统(EGS)有望在西部盆地释放最高 150 GW 清洁基荷电力,远超目前约 2.7 GW 的传统地热装机容量。 背景脉络 传统地热依赖自然发生的水热储层,分布受地质限制。EGS 采用压裂类钻技术在干热岩中人工创造储层,因而可以把地热开发延伸至传统资源匮乏地区。美国地质局估算仅大盆地就有 135 GW 潜力。 行业影响 Fervo Energy 正在犹他州建设全球最大 EGS 电站(计划 100 MW 第一阶段),并与 Turboden America 签订 1.75 GW 有机朗肯循环涡轮供货协议。内政部已释放 1.715 亿美元用于下一代野外规模测试,特朗普政府对地热的持续支持使该技术有望成为电网调频和能源安全的重要补充。 Asahi Linux Progress Linux 7.0 项目定位 Asahi Linux 致力于在 Apple Silicon Mac 上运行主line Linux,最新进展伴随 Linux 7.0 发布。 核心能力 * 安装器通过 GitHub Actions 自动化构建,解决了因设备树不同步导致的 live‑media 启动失败。 * 新增 Ambient Light Sensor 固件存放在 EFI 分区,配合 Dracut 模块实现 macOS 恢复模式下的固件重建。 * 通过 Power Management Processor (PMP) 驱动将 M1 Pro 空闲功耗降低约 0.5 W(约 20%)。 * 蓝牙与 Wi‑Fi 共享 2.4 GHz 频段的干扰经由 Broadcom HCI 扩展得到内核调度优化,消除音频丢失。 * 变频率(VRR)通过 Display Controller 参数实现,待内核补丁合并后可通过 appledrm.force_vrr 强制启用。 使用场景 开发者可借助更新的安装器在 M1、M1 Pro、M1 Max、M1 Ultra 及最新 M3 机型上获取完整硬件支持,包括 PCIe、键盘/触控板、SMC、NVMe 等。Fedora Asahi Remix 44 计划在此基础上提供现代 KDE Plasma 桌面,为希望在 Mac 硬件上运行原生 Linux 的用户提供稳定选择。 GnuPG – post‑quantum crypto landing in mainline 核心亮点 GnuPG 2.5.19 首次在主线合并 Kyber(ML‑KEM / FIPS‑203)后量子加密算法,为 OpenPGP/S/MIME 提供抗量子密钥封装与签名能力。 关键特性 * 新增 --use-ocb-sym 与 --show-[only-]session-hash 选项,改进智能卡 PIN 交互及 dirmngr keyserver 配置。 * 多项底层修复,涉及 PKCS#12 密钥长度处理、GCM 合规性、证书链检查及 RSA 填充验证。 * 提供 26 语言国际化,其中中文、德语、法语等译文近乎完成。 实际影响 用户可直接在现有 GnuPG 工作流中启用 Kyber 进行后量子安全的邮件加密与文件签名,无需更换密钥管理工具。旧版 2.4 系列两个月后将达 EOL,建议及时升级以获得量子抗性以及最新的错误修复。社区反馈表明,该版本在 Windows 64 位和平台间的兼容性得到显著改善,为后量子过渡提供了可落地的开源实现。 相关链接: * Elon Musk's xAI discussed partnership with Mistral to try and rival OpenAI
260426|座头鲸超群形成,深度学习科学理论New 10 GbE USB adapters are cooler, smaller, cheaper 亮点 新款基于 RTL8159 的 10 GbE USB 3.2 适配器售价约 80 美元,体积与发热均低于之前的 Thunderbolt 方案。 关键特性 * 支持 RJ45 接口,兼容标准以太网线。 * 在提供 20 Gbps 带宽的 USB 3.2 Gen 2×2 端口上可达到约 9.5 Gbps 下行、5 Gbps 上行。 * 热度峰值约 42.5 °C,远低于旧款 Aquantia 方案的散热需求。 * 需要正确的 USB 端口规格才能发挥全速,否则速度可能降至 6‑7 Gbps。 实际使用 桌面机器在拥有 USB 3.2 Gen 2×2 接口时实测接近满速,笔记本因端口带宽受限只能获得约 6‑7 Gbps。若仅需 2.5 Gbps 或 5 Gbps,则成本更低的适配器仍是更佳选择。社区指出 Cable Matters 提供类似产品售价约 95 美元。 Replace IBM Quantum back end with /dev/urandom 核心观点 该仓库声称利用 IBM 量子硬件破解椭圆曲线离散对数问题,实则将后端替换为操作系统随机数 /dev/urandom,结果完全取决于随机噪音。 论证逻辑 * 作者仅修改了项目中的后端调用,其余电路构建、oracle 及验证步骤保持不变。 * 在均匀随机比特流中,候选私钥的分布是均匀的,验证成功的概率遵循 1-(1-1/n)^S 公式。 * 实际测试中 4‑10 bit 曲线几乎总是成功,16‑bit 约 46 %,17‑bit 约 26 %,与理论值匹配。 * 因此观察到的“密钥恢复”仅是统计巧合,不需要任何量子计算。 延伸思考 该案例提醒读者在评估量子声明时,必须检查是否真正使用了量子后端,以及随机基线的表现。开源社区可以复现该实验,仅需普通笔记本即可验证。 There Will Be a Scientific Theory of Deep Learning 研究发现 作者提出五类研究趋势正在汇聚,预示着深度学习的科学理论即将成型:可求解的理想化模型、可求极限揭示基本规律、简单数学法则描述宏观观测、超参数理论将其与训练过程解耦、以及跨系统的通用行为。 方法简介 文献综述涵盖近期理论工作,强调这些研究共同关注训练过程的动态、粗粒度统计以及可 falsify 的定量预测。作者将此框架命名为 “learning mechanics”,并指出它与机械可解释性的互补关系。 意义与局限 该理论旨在提供可测试的预测,帮助解释为什么某些架构在特定数据上表现更好。目前仍处于概念阶段,缺少统一的数学形式化和大规模实证验证,后续需要更多跨学科实验来检验其假设。 A 3D Body from Eight Questions – No Photo, No GPU 项目定位 该项目基于 Anny 人体模型,仅凭八个问卷项(身高、体重、体型、体型构建、腹部、杯型、性别、种族)即可在 CPU 上毫秒级生成三维人体参数。 核心能力 * 通过 MLP 将问卷编码映射到 58 个 blendshape 参数,同时强制身高、体重和腰围与目标一致。 * 修正了人体密度计算中的性别差异和种族混合偏差,使质量误差降至约 0.3 kg。 * 在合成数据集上,胸围、腰围、臀围平均误差控制在 3‑4 cm,优于仅凭身高体重的回归及基于照片的管线。 使用场景 适用于虚拟试穿、尺码推荐及隐私敏感的健康应用;用户无需上传照片,全部计算在本地完成,亦提供 REST API 接口进行集成。 Plain text has been around for decades and it’s here to stay 问题背景 随着 AI 生成内容的泛滥,开发者重新审视极简的文本工具进行快速草图和文档编写。 解决方案 * Mockdown:在线即用的 ASCII 图表工具,支持网页和移动端。 * Wiretext:网页端仅限桌面使用的线框图编辑器。 * Monodraw:macOS 原生应用,提供精细的等宽字符绘图。 应用场景 这些工具适合在源码中嵌入流程图、时序图或架构示意图,也可作为尝试生成式 AI 提示的低门槛入口。社区指出其等宽字体的可移植性和长期稳定性使其在快速迭代中仍具价值。 Work with the garage door up 核心观点 公开展示工作过程(如代码草图、实验记录)比仅发布成品更能吸引真正的兴趣并建立信任。 论证逻辑 * 这种“车库门打开”的做法类似于现场直播或公开笔记,让观众看到问题探索而非只看到包装好的结论。 * 作者引用 Maggie Appleton 的观点,指出公开过程能让他人误以为你更有能力,进而获得参与高水平活动的机会。 * 同时,这种实践防止了只宣传成功而掩盖问题的营销倾向,使诚实成为个人品牌的一部分。 延伸思考 采用此方式可以促进社区反馈、发现早期错误并迭代改进。对于希望在技术社区中获得长期影响力的创作者来说,定期分享未完成的中间产出是一种低成本高回报的策略。 相关链接: * Flickr: The First and Last Great Photo Platform
260421|Anthropic 放开 Claude CLI, Roblox 作弊致 Vercel 崩溃软件工程定律合集 团队协定律 * 康威定律:组织的沟通结构会映射到系统设计中。 * 布鲁克斯定律:为落后的项目加人会让它更晚。 * 邓巴数:一个人能维持的稳定关系大约是 150。 * 价格定律:参与者的平方根贡献了约 50% 的工作量。 计划与估算 * 帕金森定律:工作会填满可用的时间。 * 霍夫斯塔德定律:任务总是比预期更久,即使已考虑此定律。 * 古德哈特定律:当衡量标准成为目标时,它就失效了。 架构权衡 * 希伦姆定律:足够多的 API 用户会依赖系统的所有可观行为。 * 加尔定律:能工作的复杂系统必然源于能工作的简单系统。 * CAP 定理:分布式系统最多只能同时满足一致性、可用性、分区容忍中的两项。 质量与技术债务 * 童子军原则:离开时让代码比你发现时更好。 * 林纳斯定律:足够多的 eyeballs 能让所有 Bug 变得浅显。 * 测试金字塔:应有很多快速单元测试、较少的集成测试、极少的 UI 测试。 设计原则 * YAGNI:只有在真正需要时才添加功能。 * DRY:每项知识应有唯一明确的表示。 * 迪米特法则:对象只应与其直接朋友交互。 Anthropic Claude CLI 在 OpenClaw 中再次获准使用 使用方式恢复 Anthropic 确认 OpenClaw 风格的 Claude CLI(包括 claude -p)在此次集成中是被允许的,除非 Anthropic 发布新政策。长期运行的网关仍建议使用 Anthropic API Key 作为最清晰的生产路径。 配置要点 * 思考默认:Claude 4.6 模型在未显式设定时使用自适应思考;可通过 /think:<level> 或模型参数覆盖。 * 快速模式:/fast on 对应 service_tier: "auto",/fast off 对应 service_tier: "standard_only"。 * 提示缓存:cacheRetention 参数控制缓存时长,默认 short(5 分钟),可设 long(1 小时)或 none。 * 1M 上下文窗口:在支持的 Opus/Sonnet 模型上启用 params.context1m: true,对应 Anthropic beta context-1m-2025-08-07。 * Claude CLI 后端:OpenClaw 已内置 Anthropic claude-cli 后端,可直接复用已有登录。 Mediator.ai:基于纳什博弈和 LLM 的公平谈判工具 产品定位 Mediator.ai 利用大语言模型将双方的自然语言陈述转化为可量化的需求,再运用 1950 年约翰·纳什的合作博弈理论寻找双方都能接受的协议。 核心能力 * 自动起草:系统生成多份候选协议,根据双方评分迭代优化,直至无更好方案。 * 结构化结果:在案例中,不仅调整股权比例,还提供管理薪金、临时回归路径、共同豁免和买卖 shotgun 条款。 * 可扩展场景:适用于创始人股权、共同居住、承包商纠纷等任何双方希望达成协议且不想被压制的情境。 实际影响 用户只需分别描述自己的立场,AI 完成谈判模拟,输出可直接使用的协议草案。演示显示,传统僵局可以转变为双赢的安排,而无需律师参与。 动态语言解释器的逐步加速之路 性能瓶颈 最初的 Zef 解释器采用 64 位带标签值、频繁 std::string 查找和递归 AST 遍历,基准慢于 CPython 35 倍、Lua 80 倍、QuickJS 23 倍。 关键优化 * 直接操作符节点:为每个运算符生成独立 AST,省去字符串比较。 * 符号替代字符串:全局哈希 consed Symbol,变量/属性查找变为指针比较。 * 内联缓存与观察点:在属性访问点缓存接收者类型和偏移,运行时检测可能被重写的名字以保证正确性。 * 参数传递自定义类型:零、一、二参数专用路径,消除堆分配。 * Getter/Setter 特化:检测纯字段读写,生成直接偏移加载/存储函数。 * 全局方法哈希表:以 (接收者类, 符号) 为键,一次查找定位目标函数。 * 值慢路径改造:按值传递,避免临时 Value 分配。 结果 经过 21 步优化后,Zef 解释器仅比 CPython 慢 2.1 倍,比 Lua 慢 4.8 倍,比 QuickJS 慢 1.35 倍;相当于比基线快 16.6 倍。使用普通 GCC(Yolo‑C++)进一步提升至比 CPython 快 1.9 倍,但该版本无法释放内存,仅适合短时基准。 Ternary Bonsai:1.58‑bit 语言模型 模型定位 Ternary Bonsai 采用三元权重 {-1, 0, +1},每 128 权重共享一个 FP16 放大因子,实际等效为 1.58 bit/weight。该方案嵌入嵌入、注意力、MLP 和语言模型头部,没有更高精度的逃 hatch。 规模与资源 * 三种规模:1.7B、4B、8B 参数。 * 8B 版约占 1.75 GB 内存,比同等 16‑bit 模型小约 9 倍。 * 在 MMLU、GSM8K、HumanEval+ 等基准上平均得分 75.5,比 1‑bit Bonsai 8B 高 5 分,仅多占 600 MB。 性能表现 * 在 Apple M4 Pro 上,8B 版吞吐约 82 token/s,能耗 0.105 mWh/token;相比同规模 16‑bit 模型快约 5 倍。 * 在 iPhone 17 Pro Max 上吞吐约 27 token/s,能耗 0.132 mWh/token,能效比全精度模型高 3‑4 倍。 * 模型可在 Mac、iPhone、iPad 上通过 MLX 原生运行,权重采用 Apache 2.0 许可证。 定位与权衡 当绝对最小占用是首要时,1‑bit 仍是最优;当允许适度增加内存以获得显著性能提升时,Ternary Bonsai 在 1.7B‑8B 区间提供了有吸引力的折中方案。 基于 CRDT 的实时类型安全图数据库 项目定位 @codemix/graph 是一个使用 TypeScript 构建的图数据库,内部借助 Yjs(一个 CRDT 库)实现离线优先、多协同编辑。支持 Zod、Valibot、ArkType 等 Schema 库进行类型声明,提供类 Gremlin 和类 Cypher 查询 API。 核心能力 * Schema 驱动:顶点、边、索引通过普通对象声明,属性在每次变更时会在编译期和运行期进行校验。 * 类型安全遍历:基于 Gremlin 风格的遍历 API,每一步都由 TypeScript 检查标签、属性键和跳数。 * Cypher 兼容:可将 Cypher-like 字符串解析为相同的遍历步骤,便于暴露给 LLM 或外部客户端。 * Yjs 后端:只需把存储层换为 YGraph,整图即成为 Yjs 文档的一部份,实现免冲突的实时同步。 * 协作属性:通过 ZodYText、ZodYArray 等包装,标题、标签等字段可在所有副本间无冲突地更新。 使用场景 * 需要实时协作的图式知识库(例如航空路线图)。 * 将图数据作为 LLM 上下文来源,通过自然语言查询获取结构化答案。 * 作为离线优先的本地先行数据库,网络恢复后自动合并更改。 以上内容均摘自今日 Hacker News 热议,供技术爱好者快速捕捉要点。 相关链接: * Laws of Software Engineering * Anthropic says OpenClaw-style Claude CLI usage is allowed again * Show HN: Mediator.ai – Using Nash bargaining and LLMs to systematize fairness * MNT Reform is an open hardware laptop, designed and assembled in Germany * Framework Laptop 13 Pro * How to make a fast dynamic language interpreter * Ternary Bonsai: Top Intelligence at 1.58 Bits * A Roblox cheat and one AI tool brought down Vercel's platform * The Beauty of Bonsai Styles * A type-safe, realtime collaborative Graph Database in a CRDT
260419|零拷贝GPU推理,旅行者一号关机Archive of Byte magazine, starting with issue #1 in 1975 档案内容概览 Internet Archive 上线了 Byte 杂志全套扫描版,首期是 1975 年 9 月的创刊号。目录列出了硬件评测、编程教程、书评和读者来信等栏目。 历史意义 该期重点介绍了 Martin Research 的 MIKE2/MIKE3 模块化套件,展示了 8008 与 8080 CPU 的无缝升级路径。文章详细说明了键盘输入、七段显示和可扩展 I/O 总线的实现细节。 社区反馈 评论者指出,看到当时的硬件限制和创意解决方案让人感慨早期个人计算机的可玩性。有人分享了自己当年用类似套件构建第一台机器的经历。 College instructor turns to typewriters to curb AI-written work 事件概述 康奈尔大学德语教授 Grit Matthias Phelps 每学期让学生使用手动打字机完成模拟作业,禁止使用屏幕、在线词典和删除键。 动机与做法 她在 2023 年春季发现学生普遍依赖生成式 AI 和在线翻译完成作业,于是引入打字机练习。学生需要手动送纸、用力敲击键位以避免晕染,并听到行终铃声后回车。 教学效果 学生报告称注意力更集中、同伴互动增加。一名计算机科学专业同学表示,打字迫使他在解决问题时与同伴交流,而不是依赖 AI。评论区呼应了这一做法,认为在文字处理工具普及前纸质修改的艰辛值得在教育中保留。 Game devs explain the tricks involved with letting you pause a game 暂停实现的常见手段 多数开发者把游戏时间缩放因子(timescale)设为 0,冻结模拟而保留暂停菜单可用。为规避某些引擎在恰好为 0 时的特殊处理,会使用极小的非零值,例如 0.000000001。 多层次暂停状态 实际项目中常需要区分普通暂停、外设断开暂停、系统菜单暂停等。早期开发者会先实现普通暂停,再逐步补充特殊情况,这容易导致原有逻辑冲突。 性能优化技巧 最初的做法是让每个对象每帧检测暂停标志,开销较大。后来通过把对象组织成层级结构,只有顶层对象检查标志,从而大幅降低开销。 实际应用 开发者指出第一次实现往往粗糙,经过迭代后才能得到稳健的方案。社区补充说,在调试时故意让时间极慢可以帮助定位难以复现的 bug。 What are skiplists good for? 问题背景 在处理大规模 fuzzing 生成的执行时间线时,需要频繁查询树形结构的祖先节点。将树存放在 BigQuery 导致每步祖先查询都需全表扫描,开销呈线性增长。 解决方案:skiptree 作者将 skiplist 推广为分层表结构(tree0、tree1、…),每层保存约下层一半的节点。每行记录上层最近祖先的 ID 以及之间跳过的节点列表。查询时沿层级向上收集祖先,只需固定次数的 JOIN(约 40 次),每次开销仅相当于一次普通表扫描的两倍。 实际影响 由于表大小按几何级数下降,总开销远低于逐步扫描全表。后来作者将该逻辑迁移到自研的 Pangolin 分析数据库,进一步消除了额外的 JOIN 开销。评论者指出,虽然手写的平衡树在原始速度上仍有优势,但 skiptree 在 SQL 环境下实现简单且性能足够。 Zero-Copy GPU Inference from WebAssembly on Apple Silicon 核心亮点 在 Apple Silicon 上,WebAssembly 线性内存可以通过 mmap 直接共享给 Metal GPU,实现零拷贝数据传输。 关键步骤 1. 使用 mmap 获取页面对齐的内存块。 2. 通过 MTLDevice.makeBuffer(bytesNoCopy:length:) 把同一指针包装为 Metal 缓冲区,GPU 直接访问该内存。 3. 让 Wasmtime 的 MemoryCreator 返回该 mmap 区域,使 Wasm 模块的读写操作同样作用于同一地址。 测量结果 在 128×128 矩阵乘法测试中,零拷贝路径的 RSS 增长仅约 0.03 MB,而显式拷贝路径约为 16.78 MB;两种路径的计算延迟均约为 6.75 ms,表明额外开销几乎为零。随后在同一架构上运行 Llama 3.2 1B Instruct 模型,首次加载 229 ms,每 token 生成约 9 ms, KV cache 的序列化与恢复分别耗时 1.1 ms 和 1.4 ms,恢复后比重新预填提速约 5.45 倍。 应用前景 作者正在构建 Driftwood 运行时,利用此零拷贝链实现 Wasm actores 的状态快照和跨机器迁移。社区认为此技术为在受限沙箱中进行高效 AI 推理提供了可行路径。 The world in which IPv6 was a good design (2017) 核心观点 作者认为如果 IPv6 能在设计时摆脱以太网、Wi‑Fi 和广播的遗留约束,则可实现更简洁的网络栈。 论证逻辑 * 没有 MAC 地址、ARP、DHCP:点对点链路使源和目的地址显式,消除了地址解析与动态配置协议。 * 以多播取代广播:减少无用流量。 * IP 头部可硬件加速:因为不需要搬运以太网首部。 * 地址空间足够大以支持层次化子网和自动配置,仅在核心路由器处进行。 在此假设下,以太网交换机和 Wi‑Fi 接入点仅需工作作为 IPv6 路由器,帧头可省去 12 字节(以太网)或 18 字节(Wi‑Fi),开销仅相当于两个 64 位 IP 地址。 现实与延伸思考 实际部署中仍需保留 IPv4、以太网和 Wi‑Fi,因而需要 IPv6 的邻居发现(较复杂的 ARP)、 DHCP 以及 NAT。移动性问题同样未解决,因为传输层仍以四元组(源 IP、源端口、目的 IP、目的端口)标识会话。作者指出,使用 QUIC 的连接 ID 可在一定程度上实现与 IP 地址解耦的会话标识,这一方法已被部分厂商采纳。评论区补充说,虽然如此设想虚构,但有助于审视现有协议栈中的冗余层。 相关链接: * Archive of Byte magazine, starting with issue #1 in 1975 * College instructor turns to typewriters to curb AI-written work * Game devs explain the tricks involved with letting you pause a game * Modern Common Lisp with FSet * Updating Gun Rocket through 10 years of Unity Engine * What are skiplists good for? * Zero-Copy GPU Inference from WebAssembly on Apple Silicon * The world in which IPv6 was a good design (2017) * SPEAKE(a)R: Turn Speakers to Microphones for Fun and Profit [pdf] (2017) * NASA Shuts Off Instrument on Voyager 1 to Keep Spacecraft Operating
260418|月球尘过敏,基因加速人类进化Show HN: I made a calculator that works over disjoint sets of intervals 核心亮点 该计算器实现了区间并集算法(Interval Union Arithmetic),能够处理不相交区间的并集,使得除以包含零的区间仍能得到有界结果。 关键特性 * 支持基本运算(+、‑、*、/、^)以及常用函数(sin、cos、log、exp 等),结果始终以区间并集形式给出。 * 提供全精度模式,利用 IEEE‑754 双精度向外取舍,保证输出区间包含真实值,即便是 0.1 + 0.2 这种经典浮点误差也能得到含真值的区间。 * 语法允许裸数与区间混用,裸数被视为零宽区间,便于直接输入常数。 实际影响 对于需要传播不确定性的科学计算(如误差分析、控制系统),该工具能够自动保守地传播范围,避免手动传播误差的繁琐。开源代码已在 GitHub 上提供,欢迎 issue 报错和赞助。 All 12 moonwalkers had “lunar hay fever” from dust smelling like gunpowder (2018) 事件概述 阿波罗登月宇航员返回舱内后,均出现喉咙痛、流泪和打喷嚏等类过敏反应,NASA 将此称为“月尘过敏”。 背景脉络 月尘由尖锐硅酸盐颗粒组成,在低重力环境下长时间悬浮,易深入肺部;缺乏大气使其被太阳辐射充电,具静电吸附性,易沾附舱内设备和防护服。 行业影响 该发现促使 ESA 与全球专家合作评估月尘毒性,并探索利用月壤制作防护砖或提取氧气的途径,为未来长期月球任务提供参考。 Towards trust in Emacs 项目定位 trust-manager 是一款为 Emacs 30 信任机制设计的就时授权插件,旨在减少安全设置带来的使用摩擦。 核心能力 * 首次访问项目时弹出信任询问,选择后自动记录并记住。 * 自动将初始化文件、自定义文件及 load-path 目录标记为可信,确保自身配置不受影响。 * 提供模式行红色 ? 指示未信任缓冲区,点击即可即时授权并恢复被禁用的特性(如 Flymake)。 使用场景 适用于频繁在多项目间切换的 Emacs 用户,能够在保持安全默认的前提下,快速恢复代码检查、编译等功能,避免用户因频繁弹窗而关闭整个信任系统。 Landmark ancient-genome study shows surprise acceleration of human evolution 研究发现 分析西欧亚地区 15,836 份古DNA(含超过 1 万份新测序基因组)后,研究团队鉴定出 479 个呈强定向选择信号的基因变异,表明过去 1 万年间人类基因组演化速度显著加快。 方法简介 团队先在不同时期人群中寻找频率一致升降的变异,再剔除可由遗传漂变或人口置换解释的位点,留下经筛选的候选变异。随后将这些变异与农业引入、青铜时代等文化转型对照,观察其频率曲线。 意义与局限 结果显示免疫、皮肤色素脱落和秃发等状况的基因在农业和青铜时代经历快速选择,提示文化变迁可驱动基因组快速适应。但研究仍依赖于现有古DNA样本的地域覆盖,对非西欧亚人群的演化速度尚未给出直接证据。 Are the costs of AI agents also rising exponentially? (2025) 核心观点 虽然 AI 代理能完成的任务时长呈指数增长,但其实际使用成本(按任务时长计算的每小时费用)也在上升,可能导致性能提升背后是不可持续的算力投入。 论证逻辑 作者采用 METR 提供的性能‑成本曲线,在对数‑对数图上绘制常小时成本线(斜率 1),每条模型曲线最近点即为其最低每小时成本(“甜点”)。结果显示: * 某些模型在甜点的每小时成本已接近人工工资(≈ $120/hr),而进入性能平台后成本可跳至数倍。 * 随着任务时长增加,甜点成本呈正相关上升趋势,表明更长 horizons 需要更高的每小时支出。 * 因此,单纯看时间界线会高估实际可负担的 AI 能力。 延伸思考 若成本上升速度超过任务时长增长,前沿 AI 在经济上将逐渐失竞争力;实际部署可能滞后于性能基准,需要等待算力价格下降或架构优化才能使高时长任务在成本可接受的范围内落地。 Category Theory Illustrated – Orders 概念背景 顺序理论研究集合上满足 reflexivity、transitivity、antisymmetry(以及可选 totality)的二元关系,是理解偏序集、格以及范畴论中积、产的直觉入门。 解读要点 * 线性(全序):任意两元素可比,满足四条公理;在编程中对应可直接使用的比较函数。 * 偏序集(poset):丢弃 totality,允许不可比元素,链为其中的全序子集。 * 格:每对元素均有唯一的 join(最小上界)与 meet(最大下界);有界格还具顶元与底元。 * 范畴视角:预序即薄范畴(任意两对象间至多一态),其中的积/产分别对应 meet/join,使得序论工具可直接迁移至一般范畴论推导。 应用场景 在程序验证中用偏序描述资源分配的依赖关系;在数据库中利用格的 join/meet 实现最小公约数与最大公倍数的并行计算;在类型系统中利用预序建立子类型关系的传递性。 Amiga Graphics 项目定位 该站点收录并展示 Commodore Amiga 时期的图形作品,旨在保存该机器独特自定义芯片(如 Agnus、Denise、Paula)所实现的高彩色、硬件滚动及彩色循环等技术遗产。 核心能力 * 提供高分辨率(最高 2160px)扫描图、杂志艺术画廊及演示赛(demo‑scene)截图。 * 配有技术文章,解释显示模式、颜色循环转换器以及硬件位面操作的原理。 * 支持社交媒体同步,便于爱好者在 Twitter、Mastodon 等平台分享发现。 使用场景 复古计算机爱好者可在此参考真实硬件限制下的像素艺术技术;游戏开发者可研究 Amiga 的双缓冲与彩色循环如何在有限带宽下实现流畅动画;教育者可使用这些素材说明 16 位时代的图形硬件创新。 Michael Rabin Has Died 事件概述 以色列数学家、计算机科学家 Michael O. Rabin 于 2026 年 4 月 14 日在以色列逝世,享年 94 岁。 贡献回顾 * 与 Dana Scott 共同提出有限自动机理论,随后获得 1976 年图灵奖。 * 首次正式提出多项式时间(P)复杂度概念,独立于 Cobham 与 Edmonds 的工作。 * 发明 Miller–Rabin 素性检测、Rabin 签名算法(基于整数因子分解难度的早期公钥密码)以及 Rabin–Karp 字符串搜索(滚动哈希)。 * 在监二阶理论、树自动机及随机算法领域留下奠基性工作。 行业影响 其成果奠定了现代计算复杂度理论、加密协议以及随机算法的基础,至今仍被广泛引用于密码库、编译器优化及形式验证工具中。 Slop Cop 项目定位 Slop Cop 是一款运行在浏览器中的写作辅助工具,用于检测并标记大型语言模型生成文本中常见的修辞与结构套路,帮助作者识别并减少“通用 AI 风格”。 核心能力 * 识别超过 40 种模式,包括过度使用破折号、否定转折(“not X, but Y”)、问答即答、三重并列(“X, Y, and Z”)等。 * 标注词汇层面的陈词滥调(如 “crucial”, “vital”, “robust”)以及结构层面的套话(“At the end of the day”, “Furthermore” 开头段落)。 * 用户可自行粘贴或输入文字,实时给出匹配次数及高亮片段;提供可选的 Anthropic API 调用以启用更深层语义检测。 使用场景 适用于撰写技术博客、论文初稿或任何希望避免模板化 AI 语气的文本;编辑部可将其纳入稿件审阅流程,快速定位需人工润色的段落;个人写作时可作为自我校验工具,提高语言多样性和原创性。 Brunost: The Nynorsk Programming Language 项目定位 Brunost 是一门以挪威语 Nynorsk 为唯一标识符语言的函数式编程语言,旨在探索将母语强制用于代码命名的可行性与编程体验。 核心能力 * 语言核心包含变量(mutable open / immutable låst)、条件 viss、forKvart 及 medan 循环,以及基本数据类型(数值、字符串、列表)。 * 提供模块系统(bruk 关键字),支持自定义模块以及标准库中的终端 I/O、数学运算及进程控制。 * 异常处理采用 prøv … fang(feil) 结构,类似其他语言的 try‑catch。 * 已实现 WebAssembly 版本,可直接在浏览器中运行演示(如斐波那契、生命游戏)。 使用场景 作为教学工具帮助学生体验在母语约束下进行编程的感受;对语言设计爱好者提供一个小型实验平台,测试强制语言词典对代码可读性和错误率的影响;开源社区可在此基础上扩展标准库(如哈希映射)或构建语言服务以获得 IDE 自动补全。 相关链接: * Show HN: I made a calculator that works over disjoint sets of intervals * All 12 moonwalkers had "lunar hay fever" from dust smelling like gunpowder (2018) * Towards trust in Emacs * Landmark ancient-genome study shows surprise acceleration of human evolution * Are the costs of AI agents also rising exponentially? (2025) * Category Theory Illustrated – Orders * Amiga Graphics * Michael Rabin Has Died * Slop Cop * Brunost: The Nynorsk Programming Language
260417|Claude 设计升级,阿西莫夫最后的问题今日 Hacker News 精选关注 Anthropic 推出的视觉协作工具 Claude Design,以及对阿西莫夫经典科幻《最后的问题》中关于能源与熵的终极探讨。 Claude Design:由视觉大模型驱动的设计协作工具 核心定位与功能 Anthropic Labs 推出由 Claude Opus 4.7 驱动的 Claude Design。该工具支持设计师、产品经理和营销人员通过协作方式创作视觉作品,涵盖设计稿、原型、演示文稿及单页文案。 品牌一致性自动化 系统通过读取代码库和现有文件自动构建设计系统(Design System)。用户通过文本描述生成初稿,并使用对话、行内评论或自定义滑块进行微调,确保后续项目自动遵循品牌规范。 从设计到生产的链路 产品经理可将线框图(Wireframes)直接转交给 Claude Code 实现。设计定稿后生成的交付包(Handoff Bundle)包含开发所需的所有资产与样式,开发人员通过指令即可完成构建。合作伙伴反馈显示,该工具能将复杂页面的转化效率提升 10 倍。 阿西莫夫经典《最后的问题》:关于熵的终极博弈 AGI 的早期构想 小说探讨了人类向超级计算机 Multivac 提出的关于如何逆转宇宙熵(Entropy)的问题。Multivac 具有自我调整与修正能力,代表了早期科幻对中心化全知智能的极致想象。 技术隐喻与现实关联 故事中关于恒星能源耗尽的争论,引发了社区对云端计算(Cloud Computing)与能源效率博弈的思考。机器给出的“目前尚无足够数据以做出有意义的回答”这一回应,已成为现代技术社区的经典隐喻,并被 Wolfram Alpha 等计算引擎收录为彩蛋。 科学逻辑与创世叙事 随着文明演进,Multivac 进化为分布在超空间中的 AC。即便物质与空间消失,AC 仍在超越时空的沉思中推演重建宇宙的答案。故事结尾将科学逻辑与创世神话进行了融合。 相关链接: * Claude Design * Isaac Asimov: The Last Question (1956)
260415|谷歌AI手机,毕加索吉迹画停止使用 Flock 摄像头的隐患 监控功能描述 Flock Safety 的摄像头不仅读取车牌,还通过车辆颜色、型号、屋顶架、凹痕、轮毂甚至贴纸位置构建“车辆指纹”。其“车队分析”功能能检测经常同时出现的车辆,推断驾驶员之间的关联,并在全省执法网络中提供可搜索的历史记录,无需搜查令即可调用。 隐私与法律争议 该系统生成的移动轨迹和社交图谱已被滥用,堪萨斯州警长曾利用同一套摄像头 228 次跟踪前女友。法律学者指出,这种广域无令状追踪修复了第四修正案对“一般授权令”的禁令,但作为私公司,Flock 在数据收集与销售上处于监管灰色地带。 社区观点与影响 评论者指出,即便声称提升安全,缺乏独立研究支持其犯罪下降效果,而社区主导的安全项目(如 READI Chicago)已展示可枪击暴力下降 58% 的实际成效。多数人认为,真正的安全应来自赋能社区而非全民监控。 修复 Enlightenment E16 中 20 年老 bug 问题重现 打开特定 PDF 时,E16 窗口管理器会因文本居中省略循环陷入无限循环,导致 X11 会话完全卡住。调试显示循环卡在 TextstateTextFitMB 函数中,nuke_count 在两个值之间震荡。 Newton 法循环缺陷 该循环试图用类似牛顿法的估计 cw = width / len_n 来调整删除的字符数,却未设置迭代上限或容错,导致在特定宽度下产生永久震荡。宽容度被设为 nc2 ∈ [0, 3·cw),过于严格,使得普通标题能收敛而长标题则无法退出。 修复方案 作者在循环头部加入迭代计数器,超过 32 次后强制接受当前尝试;同时将 nuke_count 下限设为 1、cw 下限设为 1,防止负值或除零。补丁適用于 ASCII 和多分支路径,确保有限时间内终止并选择第一个可行的截断方案。 波列茨 Pravetz:保加利亚的 Apple II 逆向工程 历史背景与硬件克隆 20 世纪 80 年代,保加利亚在铁幕下通过复制 Apple II 原理图、使用苏联克隆芯片并改造字符集为全大写西里尔字母,大规模生产 Pravetz 系列个人计算机。该国一度供应来自东欧经互会 40% 的机器,展示了在缺乏正规渠道下通过结构分析实现技术转移的可行性。 ISCAS-85 基准逆向 十多年来,研究者只知道 ISCAS-85 门级网表的形状,不知其功能。1999 年,Michigan 小组将每个电路分配给博士生,通过寄存器传输层剖析成功识别出中断控制器、ALU、乘法器等具体模块,为后续测试与合成提供了行为规格。 对现代技术的启发 评论认为,逆向工程不仅是历史趣事,而是理解与再造系统的核心方法。正如 Pravetz 表明文献与动手实践能培育整代工程师,ISCAS 的恢复表明只要具备足够的结构信息,功能就能被重新发现,这对今天的开源硬件与固件审计同样适用。 Dependency cooldowns 如何制造免骑者 个人行为的免骑效应 依赖冷却(在发布后等待 N 天再升级)依赖他人先行踩雷,将发现恶意包的成本外推到未配置冷却的用户身上。虽然对个体来说略有防护作用,但把整个生态绑定在“牺牲品”上,系统道德上站不住脚。 上传队列的集体方案 与其让每个项目自行配置冷却,不如在中央索引实施上传队列:新版本发布后先在服务器端停留几天,期间可运行安全扫描、提供公开差分、召集志愿 beta 测试。这种做法把检测责任上移,消除了个人免骑,且不需要每个包管理器或项目做额外配置。 对 AI 生态的延伸 评论指出,随着把 Markdown 当作可执行文件的趋势(如 LLM 能直接调用代码片段),同样的供应链风险也会落到模型提示或数据文件上。为 AI 分发的“包管理器”同样需要上传队列,以防止毒化提示或泄露 API 凭证的攻击。 Google Gemma 4 在 iPhone 上运行实测 模型变体与性能 Gemma 4 提供 E2B(20 亿)和 E4B(40 亿)等轻量变体,专为移动设备的内存与热限制优化。基于 iPhone GPU 的基准显示,31B 模型的响应延迟与云端相当,且在离线状态下保持一致的吞吐量。 离线推理的实际意义 由于全部推理在设备本地完成,无需联网,Gemma 4 能用于现场医疗、野外作业或任何对数据隐私有严格要求的场景。开发者只需从 App Store 下载 Google AI Edge Gallery,选择模型变体即可开始离线实验,省去 API 密钥与配置步骤。 开发者与企业的使用场景 评论者指出,虽然 31B 模型在部分基准上仍落后于同等规模的开放模型,但 E2B/E4B 变体在实际移动应用中提供了足够的语言理解与图像识别能力,适合构建无后端依赖的个人助手或现场数据标注工具。企业可利用其离线属性满足合规审计,同时减少对云计算的带宽与成本依赖。 Wacli — WhatsApp CLI 工具 核心功能与工作流 Wacli 基于 whatsmeow 库实现了 WhatsApp Web 协议的本地同步、离线搜索以及消息发送。首次运行需通过二维码登录,随后可使用 wacli sync --follow 持续后台同步聊天记录,所有数据保存在 ~/.wacli 目录下的 SQLite 数据库中。 离线搜索与消息发送 内置全文搜索支持对消息正文、回复、反应以及媒体类型进行过滤,wacli messages search "keyword" 能在离线状态下快速定位历史。发送文本或文件同样简洁,wacli send text --to NUMBER --msg "hi" 或 wacli send file --file pic.jpg --caption "photo" 即可完成。 社区反馈与未来计划 使用者称赞其免除频繁打开手机的需求,特别是在需要快速检索旧对话时。部分评论建议增加多账户切换与端到端加密备份功能,项目维护者已在路线图中列出对应的计划,预计在后续版本中实现。 在 Pomera DM250 上安装 OpenBSD 教程 准备工作与固件备份 先用官方工具将 eMMC 制作完整镜像备份,防止刷机失败导致设备无法充电。获取自定义 U-Boot 镜像、安装脚本 _sdboot.sh 以及最新的 OpenBSD armv7 快照镜像,依次写入 SD 卡的 EFI 分区与 OpenBSD 分区。 安装步骤与内核替换 将 SD 卡插入 DM250,按住右 Shift + 左 Alt + 电源键启动恢复内核,恢复脚本会备份现有 U-Boot 并写入新镜像。重启后进入 U-Boot 引导菜单,执行 b bsd.rd 启动安装程序,选择整个 eMMC 作为目标磁盘,完成基础系统后将自行编译的内核复制回 /bsd 并禁用 reorder_kernel 以防止内核被还原为上游版本。 后续配置与故障恢复 首次启动需将备份的固件文件 nvram_ap6212a.txt 复制到 /etc/firmware,随后可通过放置 logo.bmp 在 EFI 分区根目录来定制开机 Logo。若设备卡在 MaskROM 模式,使用 xrock 工具通过 USB 线重新刷入 U-Boot 并恢复已备份的 eMMC 镜像。评论指出,整个过程尽管需要自行编译内核,但提供了完全开放的堆栈,适合希望在专用硬件上运行受控 OpenBSD 的爱好者。 相关链接: * Stop Flock * Fixing a 20-year-old bug in Enlightenment E16 * A communist Apple II and fourteen years of not knowing what you're testing * Dependency cooldowns turn you into a free-rider * Picasso’s Guernica (Gigapixel) * Installing OpenBSD on the Pomera DM250 Writerdeck * Understanding Clojure's Persistent Vectors, pt. 1 (2013) * Want to Write a Compiler? Just Read These Two Papers (2008) * Wacli – WhatsApp CLI * Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference