Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills
Summary
大语言模型(LLM)智能体正越来越多地依赖可重用技能(Reusable skills):即结合了指令、控制流、约束条件和工具调用的能力包。然而,在当前的智能体系统中,技能仍由重文本的伪影(Text-heavy artifacts)来表示——主要是 SKILL.md 样式的文档,其机器可用的证据很大程度上仍然嵌入在自然语言描述中。
因此,以技能为中心的智能体系统面临着一个表示问题:无论是在智能体执行期间管理技能集合还是使用技能,都需要对调用接口、执行结构和具体的副作用进行推理,但这些信号往往纠缠在单一的文本表层中。因此,对技能知识进行显式表示,可能有助于使这些伪影更易于被机器获取和利用。
借鉴 Schank 和 Abelson 关于认知语言学表示的经典著作中的记忆组织包(Memory Organization Packets)、剧本理论(Script Theory)和概念依赖(Conceptual Dependency),我们引入了(据我们所知)首个针对智能体技能伪影的结构化表示——SSL(Scheduling-Structural-Logical,即调度-结构-逻辑)表示。它将技能层的调度信号、场景层的执行结构以及逻辑层的动作/资源使用证据进行了解耦。
我们使用基于 LLM 的规范化器(Normalizer)对 SSL 进行了实例化,并在技能发现(Skill Discovery)和风险评估(Risk Assessment)两个任务中对基于 SSL 推导的表示进行了评估。实验表明,SSL 显著优于纯文本基线:
在技能发现中,MRR@50 从 0.649 提升至 0.729;
在风险评估中,Macro F1 从 0.409 提升至 0.509。
这些发现表明,显式的、基于源(Source-grounded)的结构可以使智能体技能更易于搜索和审查。这使得 SSL 成为迈向更具可检查性、可重用性和操作可行性的技能表示的切实一步,而非一个终极标准或端到端的技能管理机制。
原文链接:arxiv.org

