
Opanclaw Agent Team1. Agent team 研究方法 00:00 四个部分,九层技术栈 01:09 2. 第一部分,创建 agent 个体 01:26 开启多个 openclaw,还是一个 openclaw? 01:42 Layer-1. 创建正式工 agent 和临时工 sub-agent 02:21 Layer-2. 角色权限 05:20 Layer-3. 工具:skill + plugin + node 06:56 Layer-4. 工具的白名单黑名单 08:24 3. 第二部分,创建 agent 团队 10:45 Layer-5. 通信:单聊,群聊开会,开放社区 10:55 session_send, shared_session, moltbook Layer-6. 组建工作流程 13:59 cron, heartbeat, event, hook/webhook. 4. 第三部分, 系统监控和优化 17:33 Layer-7:部署:sandbox/docker, vpn/tailscale 17:43 Layer-8: 仪表盘,成本优化 19:09 5. 第四部分,应用场景 20:39 ERP: Obsedian 整理会议记录,提炼用户需求, frappe 对接 ERP 21:19 自媒体:AI 操控浏览器 23:43 6. 本系列结束语 24:08 下一个系列不是短视频,而是教程文章+范例源代码,逐个讲解各个技术要素的实操。
OpenClaw: CDP, ACP, A2UI1. 如何使用 plugin 和 node 自行开发 openclaw tool? 00:00 案例分析:操控浏览器,操控编程工具,操控屏幕渲染 00:46 2. plugin + node + skill,三位一体的组合 01:16 案例:在中国移动官网,给手机充值 01:25 plugin:把描述任务目标的 tool_call,翻译成操作步骤 CDP 02:02 3. 黑客秘笈,绕过 plugin 和 node 03:52 如何实现黑客秘笈 04:23 黑客秘笈两大硬伤 05:09 4. 案例研究:操控浏览器 06:15 4.1 plugin:解析器 06:35 plugin 的双重使命 06:52 plugin 在第二冲程的作用: 把网页翻译成 text map 07:26 plugin 在第四冲程的作用: 把描述任务目标的 tool_call,翻译成操作步骤 08:45 CDP: Chrome DevTool Protocol 09:23 4.2 node: 化身浏览器插件 10:18 CDP -- debugging_engine -- chrome browser api 11:03 4.3 复盘,两个看点: 11:46 plugin -- node tool_call -- CDP -- chrome browser api 5. 案例研究:操控编程工具 vs-code 13:18 两个看点: plugin -- node tool_call -- ACP -- vs-code api 6. 案例研究:操控屏幕渲染 canvas 15:46 只有 node,没有 plugin AI 大模型直接生成 A2UI,跳过 tool_call openclaw gateway 提供专用的 http 端口 7. summary 20:04 自行开发我们自己的 openclaw plugin & node
Openclaw Plugin & Node1. Pi 引擎的第四冲程中的三个坑 00:00 tool 的注册,稳定生成 tool_call json 的保障,输入参数的解析 03:21 2. 成功注册了的 tool,长什么样? 06:55 如何查看 openclaw 认证了的 tools 06:55 tool 的两种形态 plugin & node 09:42 3. Plugin 11:14 用什么语言开发 plugin 11:14 如何安装 plugin 11:57 如何注册 plugin 13:46 谁负责执行 plugin 15:29 4. Node: 17:56 Node 运行在 gateway 体外 17:56 如何注册 node 18:26 如何同意接收 node 19:49 5. 总结与预告 21:17 三个样板案例: CDP, ACP, A2UI
Integrate Pi into Openclaw1. Relationship between Pi and Openclaw 00:00 Review of the openclaw gateway application layer 00:08 Pi:Openclaw == Kernel:OS 01:35 2. Openclaw bootstrapping 03:44 3. The entrance to Pi from Openclaw 06:31 Find the agent profile 07:57 Find or create the session log 09:14 4. pi loop's 5 sprints 11:04 sprint-1: bind agent profile, start session 11:44 sprint-2: assemble the prompt 12:05 sprint-3: call the AI model 12:29 sprint-4: execute the tool 12:39 sprint-5: reply to the user. 13:44 5. Pitfall of sprint-2 14:23 step-1: pi searches for 5-10 related skills. 15:07 step-2: cheap AI model selects 1-2 top skills. 16:06 step-3: pi assemble the real prompt. 16:32 6. Pitfall of sprint-4 18:30
PI: pi-coding-agent# 1. Layer-3. pi-coding-agent: 00:00 # 2. What is session? 00:40 Session log, tree structure: 01:46 Session compaction: 04:17 # 3. Tool factory: 06:02 # 4. Extension: 07:40 # 5. Summary and next: 10:10
PI: pi-ai & pi-agent-core# 1, Why does Openclaw need Pi? 00:00 # 2. Layer-1. Pi-ai: 01:35 Unify the inputs & outputs of various AI models. Context handoff: 03:32 # 3. Layer-2. Pi-agent-core: 06:48 5-sprint agent loop: 07:21 Events & event handlers: 11:32 Abort, Interrupt & followup: 14:16 # 4. Summary and next: 15:13
OpenClaw Gateway Internal 02L5. Memory 00:11 1. Short-term: chat history, session log, 2. Long-term: md file, sqlite db, graph. 3. Hybrid search: keyword + vector. 01:40 L6. Application 02:43 1. Channel, 2. AI runtime: pi, * skill + acp + tool + node, * skill + acp + tool + node, 04:37 3. Doctor 05:27 复盘 gateway 的 6 层结构 06:01 总结和预告 07:13
OpenClaw Gateway Internal 01Gateway 6-layer stack 00:54 1. Runtime, 2. Communication, 3. Security, 4. Deployment, 5. Memory, 6. Application L1. Runtime: nodejs 02:03 1. Non-blocking I/O: queue 2. Event-driven: event in the queue 3. Single thread main loop: promise-callback 4. Async worker thread pool. L2. Communication: ws + http 03:44 1. ws + wss, http + https, http/1 + http/2 2. Not yet supported: MQ, DSS L3. Security 06:36 1. Inbound authentication 鉴权, 2. Outbound authorization 授权, 3. Operation policy / rule 规则. L4. Deployment 08:15 1. Multi-gateway 用法: 灾备、分流,分工, 08:22 2. Separate from gateway: systemd, web server, mcp server, 09:40 3. Docker, 11:26 4. Distributed system: tailscale for vpn, bonjour for mDNS, 12:02
访谈 OpenClaw-China# 1. OpenClaw-China 项目背景 00:00 # 2. 研发 OpenClaw-China 的时间和动机 01:26 # 3. OpenClaw-China 的设计开发思路 02:05 1. 让 AI 阅读 Openclaw 源代码,整理开发指南 2. 让 AI 联网搜索,整理钉钉接口文档 3. 让 AI 辅助编程开发 # 4. Prompt engineering 04:32 1. Function spec,2. Design spec,3. Task spec # 5. 以 Telegram Channel 源代码为范本 07:29 # 6. 把钉钉 channel 作为首款落地产品 08:17 # 7. 如何面对大厂原厂的竞争 09:36 # 8. 后续规划:Clawra 二次开发 12:00 # 9. Clawra 在 2B 场景中的应用 14:54 # 10. OpenClaw-China 志愿者如何分工配合 18:21 # 11. OpenClaw-China 社群成员 19:42 # 12. 如何均衡工作与生活,包括锻炼 20:54 # 13. 总结 22:56
OpenClaw Channel Internal1. OpenClaw channels: 00:14 1.1 国产 openclaw-china, 1.2 为什么要研究 OpenClaw channel, 1.3 OpenClaw channel 三要素。 2. 解剖 Discord channel: 03:05 2.1 Discord 名词解释, 2.2 在 discord server 中,加入 discord bot,OAuth2.0。 3. Discord bot 与 OpenClaw 的通信方式: 04:07 3.1 websocket 四阶段, 3.2 http:slash 命令直接调用功能,例如 /info。 4. OpenClaw Dashboard: 06:18 4.1 web-chat: mini 微信, 4.2 http: control-panel。 5. OpenClaw TUI: 07:04 运行在终端里的 dashboard。 6. SSH tunneling,tailscale tailnet: 07:28 组网、安全措施, SSH,tailscale 上面承载着 websocket 和 http。 7. 鉴权方式: 09:01 7.1 OAuth2.0, 7.2 HTTP token, 7.3 API key/secret, 7.4 DM pairing == 验证码 8. 总结及预告: 11:18
OpenClaw 系统架构00:28 为什么要解剖 OpenClaw 02:30 如何解剖 OpenClaw 04:05 OpenClaw 的主要模块 04:25 Channel 05:33 Gateway 08:11 Agent runtime 09:20 Skill & Tool 10:00 Agentic tool: Canvas & A2UI 10:29 Node 10:52 Distributed deployment 11:40 Summary
OpenClaw 解剖与争议1. 1. OpenClaw 的三条新闻,它们要失控了吗? 2. 2. 几个月前,不支持人机对话的微信钉钉,现在不得不向 OpenClaw 开放了,风险如何控制? 3. 3. 为 OpenClaw 服务的 AI 大模型,有没有必要继续说人话? 4. 4. Python 版的 OpenClaw,国人逆袭的机会? 5. 5. 让软件为 OpenClaw 服务,改写软件,还是改写 OS?鸿蒙的机会来了?
游荡在电脑中的幽灵 OpenClaw1. 一个幽灵在电脑中游荡, 2. 幽灵的好坏,取决于游戏规则, 3. AI 四大战场,中美竞争态势, 4. 抄作业,把幽灵驯化成鹰犬。
面向制造的 AI3D1. AI3D 的应用场景 00:00 2. 3D 的表达方式 07:42 2.1 显性 explicit 08:03 2.2 隐形 implicit: SDF, Voxel 09:09 2.3 隐形 implicit: NERF 10:13 2.4 混搭 hybrid: 3DGS 11:06 2.5 混搭 hybrid: DMTet 11:59 2.6 混搭 hybrid: 3-plane, k-plane 12:37 2.7 组合 compositional 13:18 3. 从 3D 到 4D 13:47 3.1 Dynamic 3DGS 13:53 3.2 4DGS 14:49 4. 从 Text 到 3D 15:43 4.1 Transformer + Procedural generation 16:20 4.2 Diffusion 原理 18:17 4.3 Stable Diffusion 系统架构 19:42 5. 3D diffusion 的优化函数 21:03 5.1 SDS,SJC: DreamFusion 21:43 5.2 ISM, CSD, VSD, ASD: 噪音注入 23:04 5.3 SDS + 3DGS 23:40 6. 结语,面向制造的 AI3D 24:15
行业专家大模型 Artificial Domain Intelligence1) AGI vs ADI, 行业专家大模型 00:00 2) Agent 05:35 2.1 RAG 05:39 2.2 Deep Research 06:38 2.3 Self-memory 09:03 2.4 Multi-agents RL 10:57 3) 大模型与大算力 12:11 3.1 Transformer 架构与算力消耗 13:38 3.2 GPU 内存与硬盘 14:57 3.3 FlashAttention 17:02 4) Adapter 19:24 4.1 Low Rank Adapter (LoRA) 19:51 4.2 GaLore 21:33 4.3 K-adapter 23:14 5) Mixture of Experts 24:14 5.1 Mistral 24:29 5.2 Deepseek-V3 26:12 6) RL for reasoning 28:00 6.1 RLHF & PPO 28:22 6.2 GRPO 29:13 6.3 多轮对话的话术 30:56 7) 像专家那样说话 33:56 7.1 Direct Preference Optimization (DPO) 34:32 7.2 Kahneman-Tversky Optimization (KTO) 36:44 8) 数据与标注 37:51 8.1 数据蒸馏 38:29 8.2 Monto Carlo Tree Search 做推理标注 40:28 9) GRPO + LoRA 实战 43:02 9.1 编程和数据 43:17 9.2 测试 44:50