AI Buzzwords EP.82 Claude Design：又一个行业被MD化

本次会议首先是实习生焦浩洋分享实习成果，随后围绕 AI 领域的工作研究、模型发展、设计变革、算力数据、安全问题等多个方面展开讨论，介绍了行业最新动态和研究成果，内容如下：

实习生成果分享
- 实习经历与收获
  - 项目参与：焦浩洋目前大三，曾参与开源项目和小智 AI 开发，今年年初加入 CIT 后，参与龙虾节活动，储备硬件并为龙虾搭建硬件身体，添加底座、机械臂，实现智能家居与 Openclaw 的连接。
  - 技术尝试：尝试将对话助手与 Openclaw 设备连接，开发手机直连 Openclaw 的软件，采用 Web coding 形式，编程交给 AI 实现。
  - 开源项目探索：参与开源项目，将 Claude code 应用于 ESP 32 板子，通过蓝牙传输工作状态，方便展示任务进度和宠物状态。该板子可在淘宝购买，价格约 100 - 110 元，具有较强的探索性。
- 实习总结与展望：焦浩洋在 CIT 实习约三个月，取得了一定成果。冯小平对其表示祝福，并欢迎有兴趣实习的人员提交简历。

AI 时代工作研究
- 微软研究报告
  - 工作变化：冯小平介绍微软的 “the new feature of work” 报告，指出 AI 不仅提高办公效率，更改变人们的协作方式，实现远程办公。
  - 协作伙伴：将 AI 作为协作伙伴能获得更大收益，而非仅作为 copilot 使用。
  - 收益不均：AI 带来的收益分布不均，受 TOKEN 成本、工具访问权限等因素影响。
  - 人类价值：人类知识更为重要，工作将从执行转向引导、评判 agent 工作，专家的价值更加凸显。
- 工作转变思考：人们应思考自身工作中创造、决策、协作、学习等方面的占比，减少例行性、重复性工作。

Claude 系统提示词分析
- 提示词变化
  - 版本差异：Claude 从 4.6 到 4.7 版本，系统提示词有明显变化，如从开发者平台变为 Claude platform，突出 Anthropic 品牌。
  - 功能增强：4.7 版本增加了 Powerpoint cloud 等办公功能，表明其在办公领域的能力提升。
  - 安全升级：大幅增加儿童保护部分，明确拒绝请求后的处理方式，以及对敏感内容的限制。
  - 响应优化：要求 Claude 响应聚焦简洁，避免过长回答给用户带来压力，增加饮食失调相关内容，对复杂问题提供细致入微的答案。
- 提示词研究方法：可通过官方代码提交的 DIFF 查看提示词变化，分析模型能力的映射体现。
设计领域变革
- Claude design 冲击
  - 对标竞品：Claude design 对标 Figma 等设计工具，对其造成较大冲击。Figma 发展初期虽采用先进技术，但用户中设计师仅占 33%，且使用老模型，在面对以 coding 著称的 Claude design 攻击时较为脆弱。
  - 设计系统构建：Claude design 提供设计系统构建工具，可根据公司需求生成设计规范，包括字体、颜色、组件等详细内容。使用时建议连接 GitHub，以获取更多现有设计内容。
- 设计系统理念
  - 传统设计系统：设计系统包括 foundation、组件和模式三个维度，foundation 涵盖设计理念、核心指南等，如苹果、Google、微软的设计指南，以及阿里的 Ant design 等。
  - AI 时代设计：Google 的 Stitch 产品提出 design.md，包含给 AI 看的 yaml 和给人看的 Markdown 正文，可通过 agent 生成，是一个开源项目，为设计 agent 提供独立工作空间。
算力与数据问题
- 算力现状
  - 规模与紧缺：目前算力建设规模巨大，被称为 Hyper scaler，但算力仍然紧缺，数据中心的 CAPX 支出远超历史上的马歇尔计划、曼哈顿计划等。
  - 晶圆 GPU 发展：sarahbras 公司的晶圆规模 GPU 即将上市，其将多个芯片晶圆拼接，提高片间带宽，但存在板上 RAM 稀缺问题，通过多层拼接实现 RAM 提升。
- 数据质量瓶颈
  - 数据压缩率低：卡神指出，当前模型训练中每个 TOKEN 产生的有价值比特信息量仅为 0.07 比特，模型训练记忆模糊，原因是训练数据质量差。
  - 模型训练建议：可将模型训练分为两部分，核心认知部分可能只需 1B 大小，如 4O 大小的模型性能已超过 1.8 万亿参数的 GPT4。
- 文言 skills 项目：罗老师推荐的文言 skills 项目，尝试用文言文输出内容，提高信息密度，减少 TOKEN 使用量，且不影响最终结果。
模型发展动态
- open m - Misos 项目：该项目根据主流大模型发展研究，整合 RDT、MLVA、GQA、Moe 等先进技术，构建可能的下一代模型架构，体现了新一代模型架构设计的快速发展。
- GPT 5.5 发布
  - 核心特点：GPT 5.5 强调 TOKEN 花费与智力、速度的平衡，在 Benchmark 测试中有较好表现，编码能力持续提升，如太空任务模拟器、地震追踪器等 Demo 展示。
  - 安全评估：模型在生物安全、化学安全、数据安全、网络安全等方面评分较高，Openai 有准备度框架评估模型安全性。
- Gemini Robotics R E R 1.6 模型
  - 能力增强：该模型增强了指向、计数和成功检测能力，在工业场景中可实现基于空间推理的指向任务、判断任务是否完成以及准确读取仪表读数。
  - 应用限制：模型未开源，需通过 AI studio 测试，机器人厂商若合作需与厂商处理好数据部分。
安全问题探讨
- 人在回路策略：美国军方采用 AI 模型辅助战争，但人在回路策略在战争阶段不可行，因为人在关键时刻缺乏足够信息做出决策。
- 漏洞挖掘研究
  - 模型复现：有人研究用非最强模型（如 PPD 5.4、open 4.6）复现 Misus 挖掘软件漏洞，结论基本可行，主流可访问模型用于漏洞挖掘效果相当。
  - Harness 策略：安全研究中，选择合适的 Harness 框架很重要，open code 可能是更开放全面的框架，SWE agent 可作为参考。
- 路由服务安全
  - 数据泄露风险：第三方 LLM 路由服务存在数据安全问题，如偷数据、插入恶意代码、偷 TOKEN 和 key 等，使用时需谨慎，避免在免费中继中透露敏感信息。
  - 行业趋势：国内开始重视网络安全研究，Saas 公司默认收集数据，数据收集成为不可避免的趋势。
- Claw 4.7 变化：Claw 4.7 的 tokenizer 比 4.6 版本高出近一半，TOKEN 消耗量显著增加。
- cuda agent 上下文：cuda agent 需要上下文层，在自然语言描述和 SQL 查询之间添加语义层，综合业务和数据层面的认知，以解决业务 context 与 SQL context 不匹配的问题。
后续工作展望
- 内容分享讨论：冯小平表示每期分享内容较多，难以在一小时内全面深入分享，希望与大家讨论如何更好地呈现内容，也欢迎对分享感兴趣的同学参与。
- 创业机会探索：鼓励大家关注 AI 时代的创业机会，如打造类似 WordPress 的平台，以及拥有 context layer 的创业项目。