EP78：别再卷“提示词”了！IBM详解“上下文工程”

在“智能体”（Agentic AI）时代，为什么你精心设计的AI助手，还是会预订错国家（比如把法国巴黎订到肯塔基州的巴黎）？为什么它会无视预算，为你订下每晚900欧元的丽兹酒店？我们都沉迷于优化“提示工程”（Prompt Engineering），但这可能正是问题的症结所在。

本期节目，我们将深入探讨一个颠覆性的概念：“上下文工程”（Context Engineering）。来自IBM Technology的专家将揭示，提示工程（PE）仅仅是“提出好问题”，而上下文工程（CE）才是构建“高能系统”的关键。我们将彻底拆解为什么Agentic AI的成败，不只在于那几句提示词，而在于一个庞大、动态、程序化的“上下文”供给系统。

您将了解到：

“提示”的局限性： 为什么说“提示工程”只是冰山一角？它与“上下文工程”的根本区别是什么？

智能体为何犯傻： 通过“Agent Graham”旅行预订的灾难性失败案例，看懂缺乏“上下文”的AI有多么不可靠。

系统级解药： 什么是“上下文工程”？它如何作为一门系统级学科，为AI智能体提供完成任务所需的一切。

四大核心组件： 揭秘构建强大上下文系统的四大支柱：
记忆管理（Memory）： 如何通过短期（对话摘要）和长期（向量数据库）记忆，让智能体“记住”你。
状态管理（State）： 在复杂的多步骤任务（如订机票+酒店）中，AI如何确保自己“不掉线”。
RAG（检索增强生成）： 如何让RAG不再是“文档投喂”，而是能动态检索公司差旅政策的“精确制导”。
工具（Tools）： 智能体如何调用API、查询数据库或执行代码，真正“动手”解决问题。

最终蓝图： 一个先进的AI提示，可能是由“80%的动态上下文”和“20%的静态指令”组成的。

这不仅是一份关于AI工程实践的技术指南，更是一次对Agentic AI未来架构的深度预判。如果您想知道为什么“提示工程”会过时，以及“上下文工程”如何定义下一代AI应用的成败，本期节目将为您提供答案。

时点内容 | Key Topics

定义：提示工程 (Prompt Engineering)
它是一种“技艺”（Craft），专注于设计LLM的输入文本，包括指令、示例和格式提示，以引导模型的行为和输出。

定义：上下文工程 (Context Engineering)
它是一门更广泛的“系统级学科”（System-level discipline），专注于在推理时，以“程序化”方式组装模型所能看到的一切信息。
这不仅包括提示词，还包括：检索到的文档（RAG）、AI的记忆（Memory）以及可调用的工具（Tools）。

核心失败案例：Agent Graham的两次错误
地点混淆：用户要求预订“巴黎”的酒店，AI却订了“肯塔基州的巴黎”。这是一个上下文工程的失败，因为它没有被赋予“工具”去检查用户的日历或会议地点。
预算超标： AI预订了900欧元的丽兹酒店。这同样是CE的失败，因为它没有被赋予“上下文”（如公司差旅政策的JSON文件）来约束其行为。

提示工程的核心技术
角色分配（Role Assignment）：如“你是一个高级Python开发者”，能显著改变输出的专业度和视角。
少样本示例（Few-shot Examples）： “Show, don't just tell”，提供输入输出范例，让模型理解精确的格式要求（如JSON）。
思维链（Chain of Thought, CoT）： 强制模型“让我们一步一步思考”，以防止其在复杂推理中跳跃到错误结论。
约束设置（Constraint Setting）： 明确定义边界，如“回答限制在100字内”，防止模型“跑题”。

上下文工程的四大核心组件 (构建Agentic AI)
记忆管理（Memory Management）：
短期记忆：通过摘要（Summarizing）长对话，确保AI在上下文窗口限制内“不忘事”。
长期记忆：使用向量数据库检索用户偏好、历史行程等模式。
状态管理（State Management）：
追踪多步骤任务的进展。例如，在预订完整行程时，AI需要知道“航班是否预订成功？”“到达时间是什么？”以确保任务上下文不丢失。
RAG（检索增强生成）：
连接智能体与动态知识源。
CE中的RAG不是返回整个文档（如差旅政策），而是通过混合搜索（语义+关键词），只提取与当前任务“上下文相关”的部分（如相关条款和例外情况）。
工具（Tools）调用：
弥合LLM与现实世界的差距，使其能查询SQL数据库、获取实时定价API或执行代码。
CE负责定义工具接口和描述，引导LLM正确使用它们。

最终结论：PE vs. CE
上下文工程（CE）包含了提示工程（PE）。在运行时，最终的提示可能由80%的动态内容（来自状态、记忆、RAG）和20%的静态指令（PE）组成。
“提示工程给你更好的问题；上下文工程给你更好的系统。”