哈喽大家好,我是思琪。我想先聊第一条线——GLM 5.2 和本地推理的成本曲线,因为这条线今天给我最大的震撼,不是新模型有多强,而是"成本"这个变量第一次被打到大多数开发者真的扛得住的位置。我们先把数据摆出来:智谱 GLM 5.2 今天在 Hacker News 拿到六百六十九分、三百九十三条评论,社区讨论焦点不在跑分,而在中文场景、Agent 任务、函数调用的可用性。同一天 imil.net 那篇"RTX 5080 加 RTX 3090,80 Tok/s on Qwen 3.6 27B Q8"拿到二百六十五分——作者用一张全新 5080 配一张二手 3090,混搭出一个总价约 4,000 美元的台式机,跑 27B Q8 量化模型,生成速度 80 tok/s,已经接近一些云端 API 的体感。
本期大纲
- 开场与今日看点
- 话题一:GLM 5.2 发布 + 消费级双卡 80 tok/s——本地推理正式滑进"普通开发者日常预算"
- 话题二:Skill 包再度集体上榜——superpowers、agent-skills、AI 工具系统提示词大公开
- 话题三:苹果原生容器 + aisuite 多模型路由——开发者底座静悄悄换代
- 话题四:DeepMind 警告"百万 Agent 互联"与"AI 用得没那么多"——治理与现实双双降温
- 话题五:零上传小工具与退役手机算力——可立刻落地的 ESG 与合规创新
- 企业风控与保险科技专题:Skill 化核保、Agent 责任险、AI 使用克制度作为风控信号、本地推理给隐私核保托底
- 收尾与金句
关键新闻链接
- GLM 5.2 Is Out
- RTX 5080 + RTX 3090 双卡跑 Qwen 3.6 27B Q8、80 tok/s
- AI Coding at Home Without Going Broke
- obra/superpowers
- addyosmani/agent-skills
- x1xhlol/system-prompts-and-models-of-ai-tools
- Google DeepMind 担忧"百万 Agent 互联"
- No, everyone is not using AI for everything
- apple/container
- swc-project/swc
- chatwoot/chatwoot
- andrewyng/aisuite
- Every Frame Perfect
- Show HN: Kage – 把任意网站镜像成单文件离线副本
- Free SQL→ER 图工具,纯浏览器、零上传
- A low-carbon computing platform from your retired phones
- I indexed 669 GB of GoPro videos using M1 Max + local ML
- 为什么"重编程"是当下逆转衰老最火的路径
- Job titles of the future:Nature's Drug Designer
- 中国为何押注大型核反应堆
