在“智能体”(Agentic AI)时代,为什么你精心设计的AI助手,还是会预订错国家(比如把法国巴黎订到肯塔基州的巴黎)?为什么它会无视预算,为你订下每晚900欧元的丽兹酒店?我们都沉迷于优化“提示工程”(Prompt Engineering),但这可能正是问题的症结所在。
本期节目,我们将深入探讨一个颠覆性的概念:“上下文工程”(Context Engineering)。来自IBM Technology的专家将揭示,提示工程(PE)仅仅是“提出好问题”,而上下文工程(CE)才是构建“高能系统”的关键。我们将彻底拆解为什么Agentic AI的成败,不只在于那几句提示词,而在于一个庞大、动态、程序化的“上下文”供给系统。
您将了解到:
- “提示”的局限性: 为什么说“提示工程”只是冰山一角?它与“上下文工程”的根本区别是什么?
- 智能体为何犯傻: 通过“Agent Graham”旅行预订的灾难性失败案例,看懂缺乏“上下文”的AI有多么不可靠。
- 系统级解药: 什么是“上下文工程”?它如何作为一门系统级学科,为AI智能体提供完成任务所需的一切。
- 四大核心组件: 揭秘构建强大上下文系统的四大支柱:
记忆管理(Memory): 如何通过短期(对话摘要)和长期(向量数据库)记忆,让智能体“记住”你。
状态管理(State): 在复杂的多步骤任务(如订机票+酒店)中,AI如何确保自己“不掉线”。
RAG(检索增强生成): 如何让RAG不再是“文档投喂”,而是能动态检索公司差旅政策的“精确制导”。
工具(Tools): 智能体如何调用API、查询数据库或执行代码,真正“动手”解决问题。 - 最终蓝图: 一个先进的AI提示,可能是由“80%的动态上下文”和“20%的静态指令”组成的。
这不仅是一份关于AI工程实践的技术指南,更是一次对Agentic AI未来架构的深度预判。如果您想知道为什么“提示工程”会过时,以及“上下文工程”如何定义下一代AI应用的成败,本期节目将为您提供答案。
时点内容 | Key Topics
- 定义:提示工程 (Prompt Engineering)
它是一种“技艺”(Craft),专注于设计LLM的输入文本,包括指令、示例和格式提示,以引导模型的行为和输出。 - 定义:上下文工程 (Context Engineering)
它是一门更广泛的“系统级学科”(System-level discipline),专注于在推理时,以“程序化”方式组装模型所能看到的一切信息。
这不仅包括提示词,还包括:检索到的文档(RAG)、AI的记忆(Memory)以及可调用的工具(Tools)。 - 核心失败案例:Agent Graham的两次错误
地点混淆: 用户要求预订“巴黎”的酒店,AI却订了“肯塔基州的巴黎”。这是一个上下文工程的失败,因为它没有被赋予“工具”去检查用户的日历或会议地点。
预算超标: AI预订了900欧元的丽兹酒店。这同样是CE的失败,因为它没有被赋予“上下文”(如公司差旅政策的JSON文件)来约束其行为。 - 提示工程的核心技术
角色分配(Role Assignment): 如“你是一个高级Python开发者”,能显著改变输出的专业度和视角。
少样本示例(Few-shot Examples): “Show, don't just tell”,提供输入输出范例,让模型理解精确的格式要求(如JSON)。
思维链(Chain of Thought, CoT): 强制模型“让我们一步一步思考”,以防止其在复杂推理中跳跃到错误结论。
约束设置(Constraint Setting): 明确定义边界,如“回答限制在100字内”,防止模型“跑题”。 - 上下文工程的四大核心组件 (构建Agentic AI)
记忆管理(Memory Management):
短期记忆:通过摘要(Summarizing)长对话,确保AI在上下文窗口限制内“不忘事”。
长期记忆:使用向量数据库检索用户偏好、历史行程等模式。
状态管理(State Management):
追踪多步骤任务的进展。例如,在预订完整行程时,AI需要知道“航班是否预订成功?”“到达时间是什么?”以确保任务上下文不丢失。
RAG(检索增强生成):
连接智能体与动态知识源。
CE中的RAG不是返回整个文档(如差旅政策),而是通过混合搜索(语义+关键词),只提取与当前任务“上下文相关”的部分(如相关条款和例外情况)。
工具(Tools)调用:
弥合LLM与现实世界的差距,使其能查询SQL数据库、获取实时定价API或执行代码。
CE负责定义工具接口和描述,引导LLM正确使用它们。 - 最终结论:PE vs. CE
上下文工程(CE)包含了提示工程(PE)。在运行时,最终的提示可能由80%的动态内容(来自状态、记忆、RAG)和20%的静态指令(PE)组成。
“提示工程给你更好的问题;上下文工程给你更好的系统。”
相关链接与资源:
[视频来源]www.youtube.com
本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
