【第626期】SSL：智能体技能的调度-结构-逻辑表示法

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。
合作邮箱：zhiwudazhanjiangshi#gmail.com

今天的主题是：

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills

Summary

大语言模型（LLM）智能体正越来越多地依赖可重用技能（Reusable skills）：即结合了指令、控制流、约束条件和工具调用的能力包。然而，在当前的智能体系统中，技能仍由重文本的伪影（Text-heavy artifacts）来表示——主要是 SKILL.md 样式的文档，其机器可用的证据很大程度上仍然嵌入在自然语言描述中。

因此，以技能为中心的智能体系统面临着一个表示问题：无论是在智能体执行期间管理技能集合还是使用技能，都需要对调用接口、执行结构和具体的副作用进行推理，但这些信号往往纠缠在单一的文本表层中。因此，对技能知识进行显式表示，可能有助于使这些伪影更易于被机器获取和利用。

借鉴 Schank 和 Abelson 关于认知语言学表示的经典著作中的记忆组织包（Memory Organization Packets）、剧本理论（Script Theory）和概念依赖（Conceptual Dependency），我们引入了（据我们所知）首个针对智能体技能伪影的结构化表示——SSL（Scheduling-Structural-Logical，即调度-结构-逻辑）表示。它将技能层的调度信号、场景层的执行结构以及逻辑层的动作/资源使用证据进行了解耦。

我们使用基于 LLM 的规范化器（Normalizer）对 SSL 进行了实例化，并在技能发现（Skill Discovery）和风险评估（Risk Assessment）两个任务中对基于 SSL 推导的表示进行了评估。实验表明，SSL 显著优于纯文本基线：

在技能发现中，MRR@50 从 0.649 提升至 0.729；
在风险评估中，Macro F1 从 0.409 提升至 0.509。

这些发现表明，显式的、基于源（Source-grounded）的结构可以使智能体技能更易于搜索和审查。这使得 SSL 成为迈向更具可检查性、可重用性和操作可行性的技能表示的切实一步，而非一个终极标准或端到端的技能管理机制。

原文链接：arxiv.org