AI Buzzwords EP.82 Claude Design:又一个行业被MD化小平的IO

AI Buzzwords EP.82 Claude Design:又一个行业被MD化

49分钟 ·
播放数1
·
评论数0

本次会议首先是实习生焦浩洋分享实习成果,随后围绕 AI 领域的工作研究、模型发展、设计变革、算力数据、安全问题等多个方面展开讨论,介绍了行业最新动态和研究成果,内容如下:

  • 实习生成果分享

    • 实习经历与收获

      • 项目参与:焦浩洋目前大三,曾参与开源项目和小智 AI 开发,今年年初加入 CIT 后,参与龙虾节活动,储备硬件并为龙虾搭建硬件身体,添加底座、机械臂,实现智能家居与 Openclaw 的连接。

      • 技术尝试:尝试将对话助手与 Openclaw 设备连接,开发手机直连 Openclaw 的软件,采用 Web coding 形式,编程交给 AI 实现。

      • 开源项目探索:参与开源项目,将 Claude code 应用于 ESP 32 板子,通过蓝牙传输工作状态,方便展示任务进度和宠物状态。该板子可在淘宝购买,价格约 100 - 110 元,具有较强的探索性。

    • 实习总结与展望:焦浩洋在 CIT 实习约三个月,取得了一定成果。冯小平对其表示祝福,并欢迎有兴趣实习的人员提交简历。

  • AI 时代工作研究

    • 微软研究报告

      • 工作变化:冯小平介绍微软的 “the new feature of work” 报告,指出 AI 不仅提高办公效率,更改变人们的协作方式,实现远程办公。

      • 协作伙伴:将 AI 作为协作伙伴能获得更大收益,而非仅作为 copilot 使用。

      • 收益不均:AI 带来的收益分布不均,受 TOKEN 成本、工具访问权限等因素影响。

      • 人类价值:人类知识更为重要,工作将从执行转向引导、评判 agent 工作,专家的价值更加凸显。

    • 工作转变思考:人们应思考自身工作中创造、决策、协作、学习等方面的占比,减少例行性、重复性工作。

  • Claude 系统提示词分析

    • 提示词变化

      • 版本差异:Claude 从 4.6 到 4.7 版本,系统提示词有明显变化,如从开发者平台变为 Claude platform,突出 Anthropic 品牌。

      • 功能增强:4.7 版本增加了 Powerpoint cloud 等办公功能,表明其在办公领域的能力提升。

      • 安全升级:大幅增加儿童保护部分,明确拒绝请求后的处理方式,以及对敏感内容的限制。

      • 响应优化:要求 Claude 响应聚焦简洁,避免过长回答给用户带来压力,增加饮食失调相关内容,对复杂问题提供细致入微的答案。

    • 提示词研究方法:可通过官方代码提交的 DIFF 查看提示词变化,分析模型能力的映射体现。

  • 设计领域变革

    • Claude design 冲击

      • 对标竞品:Claude design 对标 Figma 等设计工具,对其造成较大冲击。Figma 发展初期虽采用先进技术,但用户中设计师仅占 33%,且使用老模型,在面对以 coding 著称的 Claude design 攻击时较为脆弱。

      • 设计系统构建:Claude design 提供设计系统构建工具,可根据公司需求生成设计规范,包括字体、颜色、组件等详细内容。使用时建议连接 GitHub,以获取更多现有设计内容。

    • 设计系统理念

      • 传统设计系统:设计系统包括 foundation、组件和模式三个维度,foundation 涵盖设计理念、核心指南等,如苹果、Google、微软的设计指南,以及阿里的 Ant design 等。

      • AI 时代设计:Google 的 Stitch 产品提出 design.md,包含给 AI 看的 yaml 和给人看的 Markdown 正文,可通过 agent 生成,是一个开源项目,为设计 agent 提供独立工作空间。

  • 算力与数据问题

    • 算力现状

      • 规模与紧缺:目前算力建设规模巨大,被称为 Hyper scaler,但算力仍然紧缺,数据中心的 CAPX 支出远超历史上的马歇尔计划、曼哈顿计划等。

      • 晶圆 GPU 发展:sarahbras 公司的晶圆规模 GPU 即将上市,其将多个芯片晶圆拼接,提高片间带宽,但存在板上 RAM 稀缺问题,通过多层拼接实现 RAM 提升。

    • 数据质量瓶颈

      • 数据压缩率低:卡神指出,当前模型训练中每个 TOKEN 产生的有价值比特信息量仅为 0.07 比特,模型训练记忆模糊,原因是训练数据质量差。

      • 模型训练建议:可将模型训练分为两部分,核心认知部分可能只需 1B 大小,如 4O 大小的模型性能已超过 1.8 万亿参数的 GPT4。

    • 文言 skills 项目:罗老师推荐的文言 skills 项目,尝试用文言文输出内容,提高信息密度,减少 TOKEN 使用量,且不影响最终结果。

  • 模型发展动态

    • open m - Misos 项目:该项目根据主流大模型发展研究,整合 RDT、MLVA、GQA、Moe 等先进技术,构建可能的下一代模型架构,体现了新一代模型架构设计的快速发展。

    • GPT 5.5 发布

      • 核心特点:GPT 5.5 强调 TOKEN 花费与智力、速度的平衡,在 Benchmark 测试中有较好表现,编码能力持续提升,如太空任务模拟器、地震追踪器等 Demo 展示。

      • 安全评估:模型在生物安全、化学安全、数据安全、网络安全等方面评分较高,Openai 有准备度框架评估模型安全性。

    • Gemini Robotics R E R 1.6 模型

      • 能力增强:该模型增强了指向、计数和成功检测能力,在工业场景中可实现基于空间推理的指向任务、判断任务是否完成以及准确读取仪表读数。

      • 应用限制:模型未开源,需通过 AI studio 测试,机器人厂商若合作需与厂商处理好数据部分。

  • 安全问题探讨

    • 人在回路策略:美国军方采用 AI 模型辅助战争,但人在回路策略在战争阶段不可行,因为人在关键时刻缺乏足够信息做出决策。

    • 漏洞挖掘研究

      • 模型复现:有人研究用非最强模型(如 PPD 5.4、open 4.6)复现 Misus 挖掘软件漏洞,结论基本可行,主流可访问模型用于漏洞挖掘效果相当。

      • Harness 策略:安全研究中,选择合适的 Harness 框架很重要,open code 可能是更开放全面的框架,SWE agent 可作为参考。

    • 路由服务安全

      • 数据泄露风险:第三方 LLM 路由服务存在数据安全问题,如偷数据、插入恶意代码、偷 TOKEN 和 key 等,使用时需谨慎,避免在免费中继中透露敏感信息。

      • 行业趋势:国内开始重视网络安全研究,Saas 公司默认收集数据,数据收集成为不可避免的趋势。

    • Claw 4.7 变化:Claw 4.7 的 tokenizer 比 4.6 版本高出近一半,TOKEN 消耗量显著增加。

    • cuda agent 上下文:cuda agent 需要上下文层,在自然语言描述和 SQL 查询之间添加语义层,综合业务和数据层面的认知,以解决业务 context 与 SQL context 不匹配的问题。

  • 后续工作展望

    • 内容分享讨论:冯小平表示每期分享内容较多,难以在一小时内全面深入分享,希望与大家讨论如何更好地呈现内容,也欢迎对分享感兴趣的同学参与。

    • 创业机会探索:鼓励大家关注 AI 时代的创业机会,如打造类似 WordPress 的平台,以及拥有 context layer 的创业项目。