每日科技播客 · 2026-06-15

每日科技播客 · 2026-06-15

26分钟 ·
播放数0
·
评论数0

哈喽大家好,我是思琪。我想先聊第一条线——GLM 5.2 和本地推理的成本曲线,因为这条线今天给我最大的震撼,不是新模型有多强,而是"成本"这个变量第一次被打到大多数开发者真的扛得住的位置。我们先把数据摆出来:智谱 GLM 5.2 今天在 Hacker News 拿到六百六十九分、三百九十三条评论,社区讨论焦点不在跑分,而在中文场景、Agent 任务、函数调用的可用性。同一天 imil.net 那篇"RTX 5080 加 RTX 3090,80 Tok/s on Qwen 3.6 27B Q8"拿到二百六十五分——作者用一张全新 5080 配一张二手 3090,混搭出一个总价约 4,000 美元的台式机,跑 27B Q8 量化模型,生成速度 80 tok/s,已经接近一些云端 API 的体感。

本期大纲

  • 开场与今日看点
  • 话题一:GLM 5.2 发布 + 消费级双卡 80 tok/s——本地推理正式滑进"普通开发者日常预算"
  • 话题二:Skill 包再度集体上榜——superpowers、agent-skills、AI 工具系统提示词大公开
  • 话题三:苹果原生容器 + aisuite 多模型路由——开发者底座静悄悄换代
  • 话题四:DeepMind 警告"百万 Agent 互联"与"AI 用得没那么多"——治理与现实双双降温
  • 话题五:零上传小工具与退役手机算力——可立刻落地的 ESG 与合规创新
  • 企业风控与保险科技专题:Skill 化核保、Agent 责任险、AI 使用克制度作为风控信号、本地推理给隐私核保托底
  • 收尾与金句

关键新闻链接