智能共生：MIT前沿AI课笔记

107已订阅

智能共生：MIT前沿AI课笔记

MoraJiang

单集更新

节目详情

EP09：多智能体路由
EP09：多智能体路由一个 AI 助手不够用？OpenClaw 支持多个 Agent 协同工作，自动路由到最合适的 Agent，还能派生子智能体处理复杂任务。 📝 章节标记 * 多智能体路由：快递公司的"调度中心"，根据任务自动分配到最合适的 Agent * 路由绑定：agentId + match，给"调度中心"定"分配规则" * 子智能体：sessions_spawn，快递公司的"临时工"，处理复杂子任务 * 广播组：broadcast，快递公司的"群发通知"，一个消息同时发给多个 Agent ✨ 本期亮点 * 多智能体架构：为什么需要多个 Agent？不同 Agent 擅长不同任务，协同工作更高效 * 路由规则配置：根据关键词、用户、渠道等条件，自动路由到最合适的 Agent * 子智能体实战：复杂任务自动拆解，派生子智能体处理，主 Agent 负责协调 * 广播组使用：一个消息同时发给多个 Agent，适合需要多个专家共同决策的场景适合人群：需要多个 AI 助手协同工作的团队、希望自动化任务分配的管理员、对 AI Agent 架构感兴趣的人关键词：#多智能体 #路由 #子智能体 #广播组 #任务分配
10分钟 · 12天前
2
0
EP08：多渠道接入
EP08：多渠道接入只想在 Dashboard 跟 AI 说话太局限？OpenClaw 支持 Telegram、飞书、WhatsApp、邮件等多种渠道，一个 AI 助手处处都在。 📝 章节标记 * 多渠道接入是什么：快递公司的"多个营业点"，一个系统多处可访问 * 渠道接入配置：给"营业点"办"开业手续"，配置每个渠道的参数 * 入口治理：快递公司的"门禁系统"，控制谁能通过哪个渠道访问 * 渠道能力配置：给"营业点"配置不同的"服务权限"，不同渠道可以有不同的能力 ✨ 本期亮点 * 多渠道架构揭秘：一个 Gateway，多个渠道，就像快递公司有多个营业点 * 渠道配置实战：Telegram、飞书、WhatsApp、邮件，一步步教你怎么接 * 入口治理详解：白名单、黑名单、限流，控制访问权限，防止滥用 * 渠道能力配置：不同渠道配置不同的工具策略，让每个渠道各司其职适合人群：希望在多平台使用 OpenClaw 的用户、需要团队协作的管理员、对 AI Agent 多渠道部署感兴趣的人关键词：#多渠道接入 #Telegram #飞书 #渠道配置 #入口治理
11分钟 · 12天前
1
0
S04EP07：会话与记忆
EP07：会话与记忆 AI 总是"忘记"你刚才说的话？OpenClaw 的"会话"和"记忆"机制让它像真人一样记住上下文，还能长期记忆。 📝 章节标记 * 会话（Session）：OpenClaw 的"工单"，记录完整对话历史 * 上下文（Context）：做菜时的"备料盘"，当前任务的所有相关信息 * 记忆（Memory）：AI 的"长期记忆"和"短期记忆"，跨会话记住重要信息 * 会话管理命令：像快递公司的"工单管理系统"一样查看和管理会话 ✨ 本期亮点 * 会话机制详解：为什么 OpenClaw 能记住你刚才说的话？Session 就像工单，记录完整历史 * 上下文管理：Context 就像备料盘，把当前任务需要的信息都准备好 * 记忆系统揭秘：短期记忆（当前会话）+ 长期记忆（跨会话），让 AI 真正"记住"你 * 会话管理实战：openclaw session list/show/clear，轻松管理所有会话适合人群：希望 AI 记住上下文的开发者、需要长期记忆功能的用户、对 AI Agent 会话管理感兴趣的人关键词：#会话管理 #上下文 #记忆系统 #Session #长期记忆
8分钟 · 24天前
5
0
S04EP06：技能与插件
EP06：技能与插件同样的提示词每次都要重新写？OpenClaw 的"技能"和"插件"让你一次封装、处处复用，还能接入外部能力。 📝 章节标记 * 技能（Skill）：OpenClaw 的"标准化操作手册" * 插件（Plugin）：OpenClaw 的"外部合作商" * 技能 vs 插件：区别与联系，内功 vs 外援 * 技能与插件的安装和管理：像公司培训和商务合作一样简单 ✨ 本期亮点 * 技能详解：把"怎么做好一件事"封装成经验包，Agent 装上就能获得你的经验 * 插件揭秘：通过 MCP 或自定义 API 接入外部能力，让 Agent 能调用"外援" * 二者区别一文搞懂：内部手册 vs 外部合作商，来源、安装方式、呈现形式全对比 * 安装管理实战：openclaw skill install/list/update/remove，以及 MCP 插件配置适合人群：想要复用提示词和工作流的开发者、希望扩展 OpenClaw 能力的用户、对 AI Agent 定制化感兴趣的人关键词：#技能 #插件 #MCP #能力封装 #外部扩展
7分钟 · 24天前
3
0
S04EP05：工具系统
EP05：工具系统 OpenClaw 能"干活"的秘密在于"工具调用"——但它有哪些工具？怎么调用？怎么防止它"乱动手"？ 📝 章节标记 * 工具分类：只读工具 vs 有副作用工具，厨房里的"尝味"vs"加盐" * 工具清单与 tool_path：OpenClaw 的"通讯录"，每个工具都有身份证号 * 工具调用范式：AI 的"思考-行动"循环，像订外卖一样分步执行 * 工具策略：allow/deny/profile，给 Agent 画好活动圈 ✨ 本期亮点 * 工具分类原理：为什么"尝味"可以随时做，"加盐"需要审批？ * tool_path 详解：像公司通讯录一样管理和调用工具 * ReAct 循环揭秘：AI 不是一下完成任务的，它会在"思考-行动-观察"中循环 * 工具策略配置：白名单、黑名单、配置文件，三种方式灵活控制 Agent 权限适合人群：想要了解 OpenClaw 工具系统的开发者、关心 AI 安全的管理员、希望自定义工具权限的用户关键词：#工具系统 #工具分类 #工具调用 #工具策略 #ReAct
9分钟 · 1 个月前
9
0
S04EP04：模型接入
EP04：模型接入配好了 OpenClaw，但不知道怎么接 AI 模型？GPT-4、Claude、本地模型……能不能都接上，让 OpenClaw 在不同场景自动切换？ 📝 章节标记 - 配置优先级：环境变量、配置文件、命令行，谁说了算？ - 内置供应商 vs 自定义供应商：品牌店 vs 私人订制 - 密钥注入：如何安全存储 API Key（环境变量 vs SecretRef） - models status 验收：让模型"亮个相"，三步验证配置正确 ✨ 本期亮点 - 配置优先级揭秘：全局默认 + 局部覆盖，灵活管理多模型 - 内置与自定义：既能开箱即用，也能无限扩展 - API Key 安全存储：从"便签贴显示器"到"银行保险柜"的三种方式 - 模型验收三步法：格式检查、连通测试、试运行，确保配置无误适合人群：希望接入多个 AI 模型的用户、关注 API Key 安全的管理员、想要灵活切换模型的开发者关键词：#模型接入 #配置优先级 #APIKey安全 #内置供应商 #自定义供应商
10分钟 · 2个月前
10
0
S04EP03：首次对话
EP03：首次对话第一次跟 AI 说话不知道说什么？像给暗恋的人发微信一样反复删改？这集帮你破除"第一次对话恐惧症"。 📝 章节标记 - 发出第一条消息：破冰技巧和推荐问题 - 流式输出的魅力：为什么"边想边说"让人着迷 - 当 Dashboard 打不开时：实战四层诊断法 - 第一次对话的最佳实践：三个标志判断 OpenClaw 真的"活了" ✨ 本期亮点 - 破冰指南：三条推荐的第一条消息，轻松开启对话 - 流式输出体验：观察 AI "边想边说"的在场感 - 实战排障：Dashboard 打不开？用四层诊断法快速定位 - 连接感建立：第一次对话的意义不是完美答案，而是建立连接适合人群：零基础用户、第一次使用 OpenClaw 的人、担心"不知道怎么跟 AI 说话"的人关键词：#首次对话 #Dashboard #流式输出 #四层诊断 #破冰技巧
15分钟 · 2个月前
5
0
S04EP02：快速安装
EP02：快速安装想动手把 OpenClaw 装到电脑上，但看到"安装""配置""命令行"就心里打鼓？这集就是为你准备的。主播用"开箱即用"和"打印机安装"做类比，带你 5 分钟内完成 OpenClaw 安装，手把手走完 openclaw onboard 向导，发出你的第一条消息。还会教你一套"四层诊断法"—— openclaw doctor → openclaw status → openclaw models → openclaw logs，安装出问题自己就能排查。听完这集，你就能把 OpenClaw 跑起来。适合人群：零基础用户、产品经理、运营人员、任何想快速上手 OpenClaw 的人。关键词： #OpenClaw 安装、#Node.js、#onboard 向导、#API Key、# 四层诊断
15分钟 · 2个月前
7
0
S04EP01：初识 OpenClaw
EP01：初识 OpenClaw EP01｜初识 OpenClaw用"快递公司"类比，5 分钟搞懂 AI Agent 基础设施 📝 节目简介 ChatGPT 只能给建议，不能帮你干活？OpenClaw 可以！本期用"快递公司"类比，带你搞懂 OpenClaw 的 5 个核心组件：Gateway（前台接待）、Agent（快递员）、Tool（工具箱）、Session（工单）、Node（外地分公司）。听完这期，你会明白：OpenClaw 到底是怎么让 AI 真正"动手"的。适合想要入门 AI 自动化、AI Agent 开发的朋友。 🔑 关键信息 * 时长：约 15 分钟 * 难度： ⭐☆☆☆☆（零基础可听） * 对应原书：《OpenClaw入门到精通》 💡 关键金句 "ChatGPT 是一个顾问，而 OpenClaw 是一个能干活的下属。" "OpenClaw 的核心不是'生成文本'，而是'调用工具'。" "Gateway 是入口，Agent 是大脑，Tool 是双手。" 🏷️ 标签/关键词 #OpenClaw #AI Agent #开源 #自动化 #AI基础设施 #ChatGPT #工具调用 #AI入门 🎯 适合人群 * 对 AI Agent 感兴趣的开发者 * 想要自动化日常工作的非技术人员 * 正在评估 AI 基础设施的技术管理者 * 听过 ChatGPT 但不懂"AI 能干活"是什么概念的小白听众 📌 下期预告下一期（EP02）：如何安装 OpenClaw？5 分钟完成一键安装、配置模型、验证运行——零基础也能跟着做！ 📎 补充素材 * 原书链接：《OpenClaw入门到精通》by yeasy * 官方文档： https://openclaw.ai/docs * 开源地址： https://github.com/openclaw/openclaw
21分钟 · 2个月前
24
0
工业×AI：从“机器换人”到“智能觉醒”
标题：工业×AI：从“机器换人”到“智能觉醒” 介绍：当大模型在工业领域落地，我们谈论的不仅仅是“自动化的升级版”，而是一场从底层重构生产力的范式革命。本期播客，我们深度解读华为、中国信通院联合发布的《工业与AI融合应用指南》。从“黑箱”高炉的智能调优，到端到端智驾大模型的决策革命；从芯片设计的AI辅助，到矿山机械的无人化运营——我们拆解汽车、半导体、钢铁、煤矿等7大行业的真实落地方案。更重要的是，我们不仅看“现在”，更展望2035：当工业智能迈向“人机共智”、“结果即服务”，当算力成为流动的公共资源，每一位工程师、每一家中小企业将如何被重新定义？这51分钟，是带你穿越工业智能化时代的“导航地图”。 * 🚗 汽车行业：端到端智驾大模型如何让车“有路就能开”？生成式设计如何将研发周期从年缩短至月？ * 💻 半导体行业：AI如何辅助芯片设计，让良率提升、成本骤降？ * 🏭 钢铁与煤矿：当“黑箱”高炉有了预测大模型，当矿卡实现无人驾驶，安全与效率如何双赢？ * 💊 制药行业：AI如何将先导药研发从数年压缩至一个月，甚至发现全新抗生素？ * ⛽ 石化与机械装备：从油气勘探到智能机器人，AI正在重塑每一个生产环节。我们不仅聊“现在”，更展望2035： * 当“人机共智”成为常态，当“结果即服务”成为商业模式，当算力像水电一样流动普惠—— * 每一位工程师、每一家中小企业，将如何被重新定义？此外，我们还为你拆解了企业落地AI的实战方法论：“三层五阶八步”法，帮你避开“叫好不叫座”的陷阱，找到真正的ROI。无论你是行业从业者、企业管理者，还是对未来工厂充满好奇的科技爱好者，这51分钟，都将带你提前潜入2035年的智能工业世界。
51分钟 · 2个月前
20
0
S03E12-系列回顾与展望——从入门到精通的学习路径
《AI深度漫谈》E12：系列回顾与展望——从入门到精通的学习路径播客简介欢迎来到《AI深度漫谈》第十二期，也是本系列的最后一期！本期面向所有听众（从初学者到进阶者），对全系列知识进行系统回顾和未来展望。我们一起走过了从智能体入门到高级应用的完整旅程，本期将为你梳理知识地图、推荐学习路径、分享实战建议，并展望智能体的未来发展。本期内容大纲第一章：开场——我们一起走过的旅程 * 系列回顾：11期内容的精彩瞬间 * 听众成长：从好奇观望到动手实践 * 本期目标：建立完整知识体系，规划未来学习路径第二章：知识地图回顾第一阶段：基础认知（E01-E03） * E01 智能体入门：定义、特征、PEAS模型、Agent Loop * E02 智能体进化史：符号主义→连接主义→LLM时代 * E03 LLM底层揭秘：Transformer、提示工程、模型选型第二阶段：核心范式（E04-E06） * E04 ReAct范式：思考-行动-观察循环 * E05 Plan-and-Solve：规划-执行两阶段 * E06 Reflection：自我反思与持续改进第三阶段：工具与框架（E07-E08） * E07 低代码与框架：Coze、Dify、LangGraph * E08 高级能力：记忆系统、RAG、通信协议第四阶段：进阶深化（E09-E11） * E09 Agentic-RL：SFT、RLHF、GRPO训练 * E10 评估与优化：指标、基准测试、持续改进 * E11 深度研究与多智能体：复杂案例、协作架构第三章：学习路径推荐初学者路径：从入门到能搭建简单智能体 1. 必学内容：E01、E03、E04 2. 动手实践：用Coze或Dify搭建第一个智能体 3. 目标：理解基本概念，能完成简单任务开发者路径：从能用到能定制优化 1. 必学内容：E04-E08 2. 动手实践：从零实现ReAct，接入自定义工具 3. 目标：能根据需求定制智能体，优化性能研究者路径：深入原理和前沿方向 1. 必学内容：E02、E03、E09、E11 2. 动手实践：模型微调、多智能体架构设计 3. 目标：理解底层原理，探索前沿方向第四章：实战建议如何开始你的第一个智能体项目 1. 选择场景：从日常痛点出发 * 个人助手：日程管理、信息整理 * 工作辅助：文档处理、数据分析 * 学习工具：知识问答、语言练习 2. 最小可行产品（MVP） * 先实现核心功能 * 使用低代码平台快速验证 * 收集反馈，迭代优化 3. 逐步增强 * 增加工具调用 * 引入记忆系统 * 优化提示词常见误区和避坑指南 * 误区1：追求一步到位 → 建议：从简单开始，逐步迭代 * 误区2：过度依赖模型能力 → 建议：系统设计弥补模型局限 * 误区3：忽视评估 → 建议：建立评估体系，数据驱动优化 * 误区4：闭门造车 → 建议：参与社区，学习他人经验第五章：智能体未来趋势展望技术发展方向 1. 能力深化：更可靠的规划、更持久的记忆、更有效的反思 2. 多智能体协作：从简单对话到复杂社会模拟 3. 具身智能：从数字世界走向物理世界 4. 人机协作：成为人类真正可信的伙伴应用落地趋势 * 企业应用：客服、销售、研发辅助 * 个人应用：生活助手、学习伴侣、创意工具 * 行业变革：教育、医疗、金融、法律第六章：持续学习资源和社区推荐推荐资源 * 官方文档：LangChain、LlamaIndex、AutoGen * 开源项目：GitHub上的热门智能体项目 * 技术博客：关注领域专家的分享 * 论文阅读：arXiv上的最新研究活跃社区 * Discord/Slack：各大框架的官方社区 * GitHub Discussions：技术交流和问题解答 * 中文社区：知乎、掘金、CSDN相关话题第七章：结束语——从听众到创造者 * 回顾成就：我们一起完成了智能体的完整学习之旅 * 邀请行动：现在，轮到你来创造了 * 未来可期：智能体的故事才刚刚开始 * 感谢与祝福：感谢陪伴，期待你的作品适合人群 * 全系列听众：回顾知识体系 * 初学者：了解学习路径 * 进阶者：寻找深化方向你将收获 * 完整的11期知识地图 * 针对不同背景的学习路径 * 实战项目启动建议 * 持续学习资源和社区 * 对智能体未来的前瞻洞察关键词知识地图、学习路径、实战建议、未来趋势、持续学习、社区资源、从入门到精通、创造者最后的邀请最好的学习方式，就是现在，打开电脑，开始你的第一个智能体项目。感谢各位听众的陪伴，从E01到E12，我们一起走过了智能体从入门到精通的完整旅程。希望这期播客能成为你继续探索的起点。记住，智能体不是终点，它是我们探索"智能"本质的漫长旅程中，一个激动人心的新站点。从听众到创造者，你的智能体之旅，现在正式开始。
15分钟 · 2个月前
29
0
S03E11-深度研究与多智能体协作
E11：深度研究与多智能体协作播客简介欢迎回到《AI深度漫谈》第十一期！本期是综合案例进阶，讲解DeepResearch复现、MCP应用、多智能体协作架构。通过真实案例和架构解析，带你了解如何构建复杂的智能体系统，让多个智能体协同工作，完成单一智能体无法胜任的复杂任务。本期内容大纲第一章：开场——深度研究智能体的应用场景 * 什么是深度研究智能体： * 能够进行多步骤信息收集 * 综合分析多个来源 * 生成结构化研究报告 * 应用场景： * 市场调研 * 竞品分析 * 学术研究 * 投资分析第二章：DeepResearch架构解析 * DeepResearch概述：OpenAI推出的深度研究功能 * 核心能力： * 多轮搜索 * 信息综合 * 报告生成 * 技术架构： * 规划模块：确定研究方向和步骤 * 搜索模块：执行多源信息检索 * 分析模块：整合和验证信息 * 生成模块：输出结构化报告第三章：DeepResearch复现要点 * 关键组件实现： * 搜索工具集成（网页、数据库、API） * 信息提取和去重 * 可信度评估 * 报告结构化生成 * 挑战和解决方案： * 信息过载：智能筛选 * 信息冲突：多源验证 * 深度与广度的平衡第四章：MCP在多智能体中的应用 * MCP回顾：模型上下文协议 * 多智能体场景下的MCP： * 统一的工具接口 * 标准化的资源访问 * 跨智能体协作 * 实现示例：研究助手使用MCP访问多个数据源第五章：多智能体协作架构 * 为什么需要多智能体： * 任务复杂度超出单一智能体能力 * 需要不同专业领域知识 * 并行处理提升效率 * 协作模式： * 主从模式：一个协调者 + 多个执行者 * 对等模式：平等协作、分工明确 * 竞争模式：多个方案择优第六章：智能旅行助手的多智能体实现 * 场景分析：复杂旅行规划涉及多个领域 * 智能体分工： * 交通智能体：负责机票、火车票 * 住宿智能体：负责酒店筛选 * 景点智能体：负责行程规划 * 预算智能体：负责成本控制 * 协作流程： 1. 协调者接收用户需求 2. 分发任务给各专业智能体 3. 收集各智能体结果 4. 综合优化生成最终方案第七章：任务分解与分配 * 任务分解策略： * 按领域分解 * 按步骤分解 * 按依赖关系分解 * 任务分配算法： * 基于能力的匹配 * 负载均衡 * 优先级调度第八章：冲突解决 * 冲突类型： * 资源冲突：多个智能体竞争同一资源 * 结果冲突：不同智能体给出矛盾结论 * 优先级冲突：任务优先级不一致 * 解决策略： * 协商机制 * 仲裁机制 * 投票机制第九章：性能优化 * 并行化：独立任务同时执行 * 缓存策略：避免重复计算 * 通信优化：减少智能体间通信开销 * 容错处理：单个智能体失败时的应对第十章：从案例到实践 * 复现建议：从简单场景开始 * 架构设计原则： * 单一职责 * 松耦合 * 可扩展性 * 下一步：系列回顾与展望适合人群 * 希望构建复杂智能体系统的开发者 * 对多智能体协作感兴趣的技术人员 * 想了解前沿案例实现的学习者你将收获 * 理解DeepResearch等前沿案例的架构 * 掌握多智能体协作的设计方法 * 学会任务分解、分配和冲突解决 * 了解性能优化的策略关键词 DeepResearch、深度研究、多智能体、协作架构、MCP、任务分解、冲突解决、主从模式、对等模式、并行化、智能旅行助手实践建议 1. 从两个智能体的简单协作开始 2. 明确每个智能体的职责边界 3. 设计清晰的通信协议 4. 建立有效的冲突解决机制
15分钟 · 2个月前
9
0
S03E10-评估与优化
S03E10：评估与优化播客简介欢迎回到《AI深度漫谈》第十期！本期进入评估环节，讲解评估指标、基准测试、评估框架，形成"构建→评估→优化"的完整闭环。如何知道你的智能体做得好不好？如何持续改进？本期将为你提供一套科学的评估方法论。本期内容大纲第一章：开场——为什么需要评估 * 没有评估就没有改进： * 无法知道当前水平 * 无法发现改进空间 * 无法验证优化效果 * 评估的目标： * 量化能力 * 发现问题 * 指导优化第二章：评估维度 * 准确性：任务完成的正确程度 * 效率：完成任务的速度和资源消耗 * 鲁棒性：面对异常情况的稳定性 * 安全性：输出内容的安全合规 * 用户体验：交互的自然度和满意度第三章：核心指标详解 * 完成率（Success Rate）：任务成功完成的比例 * 步骤效率（Step Efficiency）：完成任务所需的平均步骤数 * 准确性（Accuracy）：输出结果的正确率 * 幻觉率（Hallucination Rate）：生成虚假信息的频率 * 延迟（Latency）：响应时间 * 成本（Cost）：API调用成本第四章：基准测试 * 什么是基准测试：标准化的测试集和评估方法 * 主流基准测试： * GAIA：通用AI助手评估 * AgentBench：智能体能力综合评估 * WebArena：网页交互能力测试 * SWE-bench：软件工程能力测试 * 基准测试的局限性第五章：人工评估 vs 自动评估 * 人工评估： * 优点：准确、全面 * 缺点：成本高、速度慢 * 自动评估： * 基于规则的评估 * 基于模型的评估（LLM-as-Judge） * 优点：快速、可扩展 * 缺点：可能引入偏差 * 混合策略：自动评估筛选 + 人工评估验证第六章：评估框架设计 * 评估流程： 1. 定义评估目标 2. 选择评估指标 3. 构建测试集 4. 执行评估 5. 分析结果 * 测试集构建： * 覆盖度：不同场景、难度 * 质量：标注准确、边界清晰 * 平衡：正负样本比例第七章：A/B测试 * A/B测试原理：对照实验 * 实施步骤： 1. 确定测试目标 2. 设计对照组 3. 分流用户 4. 收集数据 5. 统计检验 * 注意事项：样本量、测试时长、显著性水平第八章：持续评估与监控 * 线上监控： * 实时指标看板 * 异常告警 * 用户反馈收集 * 离线评估： * 定期回归测试 * 新功能评估 * 竞品对比第九章：从评估到优化 * 问题诊断： * 指标异常分析 * 错误案例归因 * 根因定位 * 优化策略： * 提示词优化 * 工具改进 * 模型升级 * 架构调整第十章：最佳实践总结 * 评估驱动开发：先定义评估，再开发功能 * 持续迭代：评估→优化→再评估 * 平衡指标：准确率 vs 效率 vs 成本适合人群 * 希望科学评估智能体的开发者 * 想了解评估方法论的技术人员 * 需要建立评估体系的产品团队你将收获 * 掌握智能体评估的核心指标 * 了解主流基准测试的特点 * 学会设计评估框架 * 建立"构建→评估→优化"的闭环思维关键词评估指标、基准测试、GAIA、AgentBench、完成率、幻觉率、人工评估、自动评估、A/B测试、持续监控、评估驱动开发实践建议 1. 从核心指标开始，逐步完善评估体系 2. 建立自动化评估流程 3. 定期回顾评估结果，指导优化方向 4. 结合业务目标定义评估标准本期播客由AI系统评估专家 B 主讲，科学、数据驱动、实用导向。
9分钟 · 2个月前
12
0
S03E09-Agentic-RL
《AI深度漫谈》E09：Agentic-RL 播客简介欢迎回到《AI深度漫谈》第九期！本期是系列技术难度最高的一期，面向有深度学习基础的听众，讲解从SFT到GRPO的训练实战。如果你想深入理解智能体背后的训练原理，掌握如何通过强化学习让智能体变得更聪明，本期内容将为你打开一扇新的大门。本期内容大纲第一章：开场——为什么需要训练 * 提示工程的局限： * 无法根本改变模型能力 * 复杂任务表现受限 * 训练的价值： * 注入领域知识 * 优化特定能力 * 对齐人类偏好第二章：监督微调（SFT） * SFT原理：在标注数据上继续训练 * 数据准备： * 高质量指令-响应对 * 数据清洗和筛选 * 数据增强技巧 * 训练流程： * 学习率设置 * 训练轮数控制 * 过拟合防范第三章：奖励模型 * 为什么需要奖励模型：量化输出质量 * 奖励模型训练： * 偏好数据收集 * 排序损失函数 * 模型架构设计 * 奖励模型评估：与人类偏好的一致性第四章：RLHF流程——PPO * RLHF（基于人类反馈的强化学习）概述 * PPO（近端策略优化）算法： * 策略网络和价值网络 * 优势函数计算 * clipped surrogate objective * RLHF训练流程： 1. 收集人类偏好数据 2. 训练奖励模型 3. 使用PPO优化策略第五章：Agentic RL的独特性 * 传统RLHF vs Agentic RL： * 传统：关注单轮输出质量 * Agentic：关注多轮任务完成度 * Agentic RL的挑战： * 长程依赖 * 稀疏奖励 * 探索与利用平衡第六章：GRPO详解 * GRPO（Group Relative Policy Optimization）： * 群体相对策略优化 * 无需价值网络 * 更适合智能体场景 * GRPO优势： * 降低内存需求 * 简化训练流程 * 更好的稳定性 * GRPO实现要点第七章：训练数据构建 * 数据类型： * 指令跟随数据 * 工具使用数据 * 多轮对话数据 * 数据质量控制： * 多样性保证 * 难度分布 * 错误样本处理第八章：训练流程实战 * 环境准备： * 硬件要求 * 框架选择（TRL、LLaMA-Factory等） * 训练配置： * 超参数设置 * 分布式训练 * 监控和调试： * 损失曲线分析 * 评估指标跟踪第九章：训练挑战 * 常见问题和解决方案： * 灾难性遗忘 * 奖励黑客 * 训练不稳定 * 调试技巧第十章：训练 vs 提示工程选择 * 选择框架： | 场景 | 提示工程 | 训练 | |------|---------|------| | 快速验证 | ✓ | ✗ | | 通用能力提升 | ✗ | ✓ | | 资源有限 | ✓ | ✗ | * 混合策略：提示工程 + 轻量级微调适合人群 * 有深度学习基础的开发者 * 希望深入理解智能体训练原理的技术人员 * 想进行模型微调的研究者你将收获 * 理解SFT、RLHF、GRPO等训练方法 * 掌握训练数据构建的方法 * 了解训练流程和调试技巧 * 学会在提示工程和训练之间做选择关键词 SFT、监督微调、RLHF、PPO、GRPO、奖励模型、强化学习、Agentic RL、训练数据、灾难性遗忘、奖励黑客学习建议 * 本期技术难度较高，建议先掌握深度学习基础 * 动手实践时从小规模模型开始 * 关注DeepSeek-R1等开源项目的训练方法
10分钟 · 3个月前
37
0
S03E08-高级能力
E08：高级能力播客简介欢迎回到《AI深度漫谈》第八期！本期进入高级知识扩展，讲解记忆系统、RAG、上下文工程、MCP/A2A/ANP通信协议。掌握这些高级能力，能让你的智能体从"能用"变成"好用"，具备长期记忆、知识检索、情境理解和标准化通信的能力。本期内容大纲第一章：开场——为什么需要高级能力 * 基础能力的局限： * 缺乏长期记忆 * 知识更新困难 * 上下文长度限制 * 智能体间通信困难 * 高级能力的价值：构建真正生产级的智能体应用第二章：记忆系统概述 * 记忆的类型： * 短期记忆：当前对话上下文 * 长期记忆：跨会话的持久化信息 * 工作记忆：临时存储和处理 * 记忆的重要性：个性化服务、连贯交互第三章：短期记忆详解 * 对话历史：维护多轮对话的上下文 * 上下文窗口：LLM的输入长度限制 * 滑动窗口策略：在有限长度内保留关键信息 * 关键信息提取：从对话中识别重要内容第四章：长期记忆实现 * 向量数据库： * 嵌入（Embedding）原理 * 相似度检索 * 主流方案：Pinecone、Weaviate、Milvus * 记忆存储策略： * 结构化存储：关键信息提取 * 非结构化存储：原始对话保存 * 记忆检索策略：语义搜索 vs 关键词搜索第五章：RAG（检索增强生成） * RAG原理：检索 + 生成两步走 * 实现流程： 1. 文档切分与向量化 2. 查询向量化 3. 相似度检索 4. 上下文增强生成 * RAG优化技巧： * 文档切分策略 * 重排序（Reranking） * 查询改写第六章：上下文工程 * 情境理解：让智能体理解当前场景 * 上下文压缩：在有限窗口内保留关键信息 * 上下文选择：动态选择最相关的历史信息 * 系统提示词优化：设定清晰的角色和行为规范第七章：通信协议概述 * 为什么需要协议：智能体间标准化通信 * 协议的作用： * 统一接口规范 * 降低集成成本 * 提升互操作性第八章：MCP详解 * MCP（Model Context Protocol）：模型上下文协议 * 核心概念： * 资源（Resources） * 工具（Tools） * 提示词（Prompts） * 应用场景：智能体与外部系统的标准化交互第九章：A2A与ANP详解 * A2A（Agent-to-Agent）：智能体间通信协议 * ANP（Agent Network Protocol）：智能体网络协议 * 协议对比：不同协议的适用场景 * 未来趋势：智能体互联网的形成第十章：高级能力综合应用 * 架构设计示例：记忆 + RAG + 通信协议 * 性能考量：延迟、成本、准确率的平衡 * 最佳实践总结适合人群 * 希望构建生产级智能体的开发者 * 对记忆系统、RAG感兴趣的技术人员 * 想了解智能体通信协议的学习者你将收获 * 理解短期记忆和长期记忆的实现方法 * 掌握RAG的原理和优化技巧 * 学会上下文工程的核心技术 * 了解MCP、A2A、ANP等通信协议关键词记忆系统、短期记忆、长期记忆、向量数据库、RAG、检索增强生成、上下文工程、MCP、A2A、ANP、通信协议、Embedding 技术建议 1. 从简单的对话历史管理开始 2. 逐步引入向量数据库存储长期记忆 3. RAG实现时注意文档切分粒度 4. 关注通信协议的标准化发展
11分钟 · 3个月前
8
0

你是否觉得，AI的世界被禁锢在“文本”与“图像”里？麻省理工学院媒体实验室的热门课程《How to AI (Almost) Anything》，正打破这一边界——它的核心并非让AI擅长模仿，而是让AI延伸人类感官与能力，理解气味、触觉等，与物理世界交互、融入社会动态，实现人机共生，提升创造力与福祉。课程主讲人Paul Liang教授及其团队，绘制了通往这一未来的蓝图。这门顶尖课程的前沿思想、讲座精华与深度讨论，被整理制作成播客系列，拒绝枯燥理论，用通俗语言+丰富案例，转译深奥学术内容。在这里，你将了解多感官智能的蓝图、多模态AI的技术核心，洞悉大模型与生成式AI的原理与局限，触碰具身AI、交互智能体等科幻感未来，探讨人机交互的伦理与挑战。无论你是AI学习者、研究者，还是科技爱好者，都能获得前瞻认知。这不是课程录音，而是一场思想探险，邀请你思考AI突破屏幕、融入万物时，我们该如何设计、引导与共处。从第一讲《Introduction：人类与AI的共生宣言》启程，订阅播客，共赴前沿思维碰撞，播客中见。