破解上下文腐烂：AI Agent 的工程化实践

引言：为什么AI智能体总是“聊着聊着就忘了”？

你是否曾好奇，为什么功能强大的AI智能体在处理复杂或长期的任务时，常常会变得混乱、效率低下，甚至“忘记”了最初的目标？明明拥有海量的知识和强大的推理能力，它们却似乎总在信息的海洋中迷失方向。

这背后隐藏着一个AI智能体面临的核心挑战——如何有效处理和管理源源不断的信息流。简单地把所有信息都塞给模型，并不能让它变得更聪明。问题的关键，在于一门新兴的、至关重要的技术学科：上下文工程 (Context Engineering)。

这并非又一个关于如何写提示词的陈词滥调，而是一套系统性的方法论，旨在优化信息流，让AI智能体在正确的时间获得正确的信息。本文将分享从LangChain和顶尖AI公司Manus的实践中提炼出的4个最具颠覆性的反常识见解，揭示构建高效、可靠AI智能体的真正秘诀。

1. 反常识一：上下文越长，AI可能越“笨”——“上下文腐烂”悖论

我们通常认为，提供给AI的信息越多、上下文越完整，它的表现就应该越好。然而，现实恰恰相反。随着AI智能体交互轮次的增加，不断增长的上下文长度反而会损害其效率和准确性，这种现象被称为 “上下文腐烂 (Context Rot)”。

这就构成了一个核心悖论：智能体既需要大量上下文来完成复杂任务，但过长的上下文又会降低其性能。

Manus公司的研究发现，模型对上下文的利用率并非线性。我们可以将其想象成三个区域：

• 绿色区域 (0-128K token): 在这个范围内，模型能够有效处理和利用上下文信息。

• 橙色区域 (128K-200K token): 这是“腐烂阈值 (Pre-rot threshold)”区，模型的性能开始明显衰减。

• 白色区域 (200K token以上): 在这个区域，大部分上下文信息几乎被模型“忽略”，无法被有效利用。

这一发现揭示了一个残酷的现实：简单地扩大上下文窗口并非万能解药。真正的挑战在于如何“智能地”管理上下文，确保最关键的信息始终处于模型的“有效感知区域”内。

2. 反常识二：别只聊提示词，真正的挑战是“为AI减熵”

长期以来，我们专注于提示词工程 (Prompt Engineering)，试图通过精巧的语言教会机器如何理解任务。但这只是治标不治本。人机之间真正的“智能鸿沟 (Intelligence Gap)”，其本质是 “信息熵的不对称”。

人类天生具备强大的“熵减能力”——我们能通过共享的文化背景、情感线索和情境感知，自动补全对话中的缺失信息，将模糊的意图（高熵）转化为清晰的理解（低熵）。而机器目前严重欠缺这种能力。

因此，上下文工程 的核心工作，可以被定义为 “主动为机器进行熵减预处理”。它与提示词工程有着本质区别：

• Prompt Engineering 是一种静态的、手动的“单次任务”，为每一个孤立的请求精心设计指令。

• Context Engineering 是一种动态的、系统化的升级。它不再是手动编写提示词，而是搭建一个智能系统，这个系统能根据情境、历史记忆和知识库，“动态组装” 出最适合当前任务的最优上下文。

这个演进过程的本质，是AI逐步接管人类原本需要承担的“上下文熵减工作”。从最初需要人类将信息“翻译”成机器语言的 Context 1.0，到我们现在所处的、AI能理解自然语言指令的 Context 2.0，再到未来AI能理解完整场景的 Context 3.0，最终迈向推测中的 Context 4.0。

这正是 Context Engineering 作为系统工程的价值所在：不是让人类学会如何更好地与机器对话，而是让机器学会如何更好地理解人类——最终，在Era 4.0，机器甚至能比人类更好地理解人类自己。

3. 反常识三：给AI一个“分层工具箱”，避免“选择困难症”

当AI智能体集成的工具越来越多时，一个新问题出现了：“上下文混淆 (Context Confusion)”。面对几十上百个工具，模型会感到困惑，常常调用错误的工具，甚至“幻想”出不存在的工具。

Manus公司为此设计了一个极其巧妙的解决方案——“分层行动空间 (Layered Action Space)”。其核心思想不是简单地提供工具，而是将工具能力“卸载”到不同层次，让核心接口保持绝对简洁。这好比给AI的不是一堆杂乱的工具，而是一个井井有条的工房：

1. 第1层：原子函数调用 (Atomic Function Calls) 这就像你随身携带的瑞士军刀。它是一个小而固定的核心函数集（约10-20个），如读写文件、执行shell命令。为什么小而固定至关重要？ 因为这确保了系统的绝对稳定，模型不会混淆，并且由于调用频繁，性能上对缓存极其友好。

2. 第2层：沙盒实用工具 (Sandbox Utilities) 这相当于一个巨大的共享车间，你拥有它的钥匙。这一层包含了海量的预装命令行工具（如grep）。其天才之处在于认知负荷的卸载：系统无需在提示词中塞入每个工具的详细说明，只需告诉LLM“这个车间里有很多工具，你可以用-help命令随时查看说明书”。这使得智能体的能力近乎无限扩展，同时又完全不污染核心上下文。

3. 第3层：软件包和API (Packages and APIs) 这好比允许你就地建造一台定制机器来解决特定难题。对于数据分析等复杂任务，智能体可以编写并执行Python脚本。其最大的好处在于上下文的极致保留：所有密集的计算（例如分析一个巨大的数据集）都在外部的Python环境中完成，只有那个最终的、可能只有几个词的结论被返回给模型。这是一场保存宝贵上下文空间的经典战役。

这种分层设计，在保持核心接口简洁稳定的同时，赋予了智能体几乎无限扩展的能力，优雅地平衡了系统的安全性、稳定性和灵活性。

4. 反常识四：少做加法，多做理解——顶级AI架构的极简主义

尽管上下文工程的技术栈日益复杂，但Manus公司在实践中发现，最大的性能进步往往来自于 “简化”——移除不必要的复杂性，并给予底层的LLM更多的信任。

这不仅是一种哲学，更是一种深刻的商业与工程策略。上下文工程的真正艺术，是在性能、成本、延迟等多个相互冲突的目标之间找到微妙的平衡。Manus刻意避免对模型进行过早的专门化或微调，因为在AI技术日新月异的今天，任何针对特定模型的深度优化，都可能在下一代模型发布时变得过时。坚定地依赖通用模型，并通过卓越的上下文工程来驾驭它，才是保持产品灵活性和未来适应性的关键。

正如Manus的科学家所总结的：

少做加法，多做理解 (build less and understand more)

在快速演进的AI领域，追求一个简单、稳定、更懂模型的架构，远比盲目堆砌复杂功能更为重要。这是一种顶级AI架构所奉行的极简主义。

结论：从“管理信息”到“引导智能”

回顾这四个反常识，我们发现构建高效AI智能体的关键，并非无限堆砌信息或功能，而是通过精妙的“上下文工程”为AI进行系统性的“熵减”。

这标志着一场根本性的转变：我们正在从“管理信息”的时代，迈向“引导智能”的时代。整个上下文工程的演进史（从Context 1.0到4.0），正是一部AI系统性地从人类手中接管“熵减”工作的历史。当Context 4.0——“上下文即世界”的时代到来，AI可能比我们自己更深刻地理解我们的意图，成为激发新认知、创造新灵感的伙伴。

这也给我们留下了一个值得深思的问题：当AI的“熵减”能力最终超越人类，我们与智能体的协作关系又将演变成什么样貌？

原文：AI Agent 中的上下文工程 (Context Engineering) | Breezedeus.com