EP78:别再卷“提示词”了!IBM详解“上下文工程”

EP78:别再卷“提示词”了!IBM详解“上下文工程”

10分钟 ·
播放数56
·
评论数0

在“智能体”(Agentic AI)时代,为什么你精心设计的AI助手,还是会预订错国家(比如把法国巴黎订到肯塔基州的巴黎)?为什么它会无视预算,为你订下每晚900欧元的丽兹酒店?我们都沉迷于优化“提示工程”(Prompt Engineering),但这可能正是问题的症结所在。

本期节目,我们将深入探讨一个颠覆性的概念:“上下文工程”(Context Engineering)。来自IBM Technology的专家将揭示,提示工程(PE)仅仅是“提出好问题”,而上下文工程(CE)才是构建“高能系统”的关键。我们将彻底拆解为什么Agentic AI的成败,不只在于那几句提示词,而在于一个庞大、动态、程序化的“上下文”供给系统。

您将了解到:

  • “提示”的局限性: 为什么说“提示工程”只是冰山一角?它与“上下文工程”的根本区别是什么?
  • 智能体为何犯傻: 通过“Agent Graham”旅行预订的灾难性失败案例,看懂缺乏“上下文”的AI有多么不可靠。
  • 系统级解药: 什么是“上下文工程”?它如何作为一门系统级学科,为AI智能体提供完成任务所需的一切。
  • 四大核心组件: 揭秘构建强大上下文系统的四大支柱:
    记忆管理(Memory): 如何通过短期(对话摘要)和长期(向量数据库)记忆,让智能体“记住”你。
    状态管理(State): 在复杂的多步骤任务(如订机票+酒店)中,AI如何确保自己“不掉线”。
    RAG(检索增强生成): 如何让RAG不再是“文档投喂”,而是能动态检索公司差旅政策的“精确制导”。
    工具(Tools): 智能体如何调用API、查询数据库或执行代码,真正“动手”解决问题。
  • 最终蓝图: 一个先进的AI提示,可能是由“80%的动态上下文”和“20%的静态指令”组成的。

这不仅是一份关于AI工程实践的技术指南,更是一次对Agentic AI未来架构的深度预判。如果您想知道为什么“提示工程”会过时,以及“上下文工程”如何定义下一代AI应用的成败,本期节目将为您提供答案。

时点内容 | Key Topics

  • 定义:提示工程 (Prompt Engineering)
    它是一种“技艺”(Craft),专注于设计LLM的输入文本,包括指令、示例和格式提示,以引导模型的行为和输出。
  • 定义:上下文工程 (Context Engineering)
    它是一门更广泛的“系统级学科”(System-level discipline),专注于在推理时,以“程序化”方式组装模型所能看到的一切信息
    这不仅包括提示词,还包括:检索到的文档(RAG)、AI的记忆(Memory)以及可调用的工具(Tools)。
  • 核心失败案例:Agent Graham的两次错误
    地点混淆:
    用户要求预订“巴黎”的酒店,AI却订了“肯塔基州的巴黎”。这是一个上下文工程的失败,因为它没有被赋予“工具”去检查用户的日历或会议地点。
    预算超标: AI预订了900欧元的丽兹酒店。这同样是CE的失败,因为它没有被赋予“上下文”(如公司差旅政策的JSON文件)来约束其行为。
  • 提示工程的核心技术
    角色分配(Role Assignment):
    如“你是一个高级Python开发者”,能显著改变输出的专业度和视角。
    少样本示例(Few-shot Examples): “Show, don't just tell”,提供输入输出范例,让模型理解精确的格式要求(如JSON)。
    思维链(Chain of Thought, CoT): 强制模型“让我们一步一步思考”,以防止其在复杂推理中跳跃到错误结论。
    约束设置(Constraint Setting): 明确定义边界,如“回答限制在100字内”,防止模型“跑题”。
  • 上下文工程的四大核心组件 (构建Agentic AI)
    记忆管理(Memory Management):
    短期记忆:通过摘要(Summarizing)长对话,确保AI在上下文窗口限制内“不忘事”。
    长期记忆:使用向量数据库检索用户偏好、历史行程等模式。
    状态管理(State Management):
    追踪多步骤任务的进展。例如,在预订完整行程时,AI需要知道“航班是否预订成功?”“到达时间是什么?”以确保任务上下文不丢失。
    RAG(检索增强生成):
    连接智能体与动态知识源。
    CE中的RAG不是返回整个文档(如差旅政策),而是通过混合搜索(语义+关键词),只提取与当前任务“上下文相关”的部分(如相关条款和例外情况)。
    工具(Tools)调用:
    弥合LLM与现实世界的差距,使其能查询SQL数据库、获取实时定价API或执行代码。
    CE负责定义工具接口和描述,引导LLM正确使用它们。
  • 最终结论:PE vs. CE
    上下文工程(CE)包含了提示工程(PE)。在运行时,最终的提示可能由80%的动态内容(来自状态、记忆、RAG)和20%的静态指令(PE)组成。
    “提示工程给你更好的问题;上下文工程给你更好的系统。”

相关链接与资源:

[视频来源]www.youtube.com

本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。