每日科技播客 · 2026-06-15 - 每日科技播客 | 小宇宙

哈喽大家好，我是思琪。我想先聊第一条线——GLM 5.2 和本地推理的成本曲线，因为这条线今天给我最大的震撼，不是新模型有多强，而是"成本"这个变量第一次被打到大多数开发者真的扛得住的位置。我们先把数据摆出来：智谱 GLM 5.2 今天在 Hacker News 拿到六百六十九分、三百九十三条评论，社区讨论焦点不在跑分，而在中文场景、Agent 任务、函数调用的可用性。同一天 imil.net 那篇"RTX 5080 加 RTX 3090，80 Tok/s on Qwen 3.6 27B Q8"拿到二百六十五分——作者用一张全新 5080 配一张二手 3090，混搭出一个总价约 4,000 美元的台式机，跑 27B Q8 量化模型，生成速度 80 tok/s，已经接近一些云端 API 的体感。

本期大纲

开场与今日看点
话题一：GLM 5.2 发布 + 消费级双卡 80 tok/s——本地推理正式滑进"普通开发者日常预算"
话题二：Skill 包再度集体上榜——superpowers、agent-skills、AI 工具系统提示词大公开
话题三：苹果原生容器 + aisuite 多模型路由——开发者底座静悄悄换代
话题四：DeepMind 警告"百万 Agent 互联"与"AI 用得没那么多"——治理与现实双双降温
话题五：零上传小工具与退役手机算力——可立刻落地的 ESG 与合规创新
企业风控与保险科技专题：Skill 化核保、Agent 责任险、AI 使用克制度作为风控信号、本地推理给隐私核保托底
收尾与金句

关键新闻链接