WithAI.Design

5 min read

上下文工程的核心原则:构建可靠AI代理的基石

译者按 :

这篇文章讲透了AI代理开发中最容易被忽视的命门——上下文管理。打个比方:

你让装修队改造厨房(主任务),结果:

  • 电工按酒店标准布线(子代理1跑偏)
  • 瓦工贴了游泳池瓷砖(子代理2误解)
  • 最后监工看着混搭风傻眼(主代理崩溃)

这就是多代理架构的典型翻车现场!作者用「Flappy鸟开发车祸」这种接地气的案例,说清了两个核心道理:

  1. 别让代理当聋子(共享完整上下文)
  2. 每个动作都是承诺(行为自带决策属性)

当前AI圈痴迷的「多代理协作」,本质是让一群记忆只有7秒的金鱼开会——它们连自己刚才说过什么都记不住,更别提协调配合了。文章给出的方案异常朴实:先让单个代理像老师傅带徒弟那样靠谱,再谈团队作战

技术人常犯的错是把「能跑通demo」当成「可投产」,这篇血泪经验贴值得贴在显示器上警醒自己。

上下文工程的核心原则:构建可靠AI代理的基石

[上下文工程原则示意图


▍原则体系概览

我们将逐步展开以下核心原则:

  1. 共享上下文
  2. 行为隐含决策

▍为何需要设计原则?

HTML诞生于1993年。2013年,Facebook推出React框架。如今来到2025年,React及其衍生技术仍主导着开发者的应用构建方式。究其根本,React不仅是代码脚手架——它代表着一套反应式与模块化的哲学体系。这种如今被视为标配的设计理念,在早期Web开发中并非显而易见。

在LLM与AI代理构建时代,我们仿佛重回HTML+CSS的原始阶段,仍在探索如何拼凑出优质体验。当前代理构建领域尚未形成统一标准(除基础架构外),甚至某些知名方案存在方向性偏差:

OpenAI的 Swarm和微软的AutoGen 等库推崇的多代理架构,实则是错误的技术路径(后文将详解)。

初学者可通过资源搭建基础框架[1] [2],但构建生产级应用则需全新方法论。


▍长时运行代理的理论基石

[长时运行代理示意图

可靠性是首要挑战。当代理需长期稳定运行并保持对话连贯性时,必须建立错误控制机制,否则系统将快速崩溃。而可靠性的核心在于:

上下文工程(Context Engineering)

2025年的模型已具备超高智能,但即使最聪明的人类也需任务上下文才能有效工作。“提示工程”(Prompt Engineering)指为LLM优化任务描述的技艺,而上下文工程是其高阶形态——在动态系统中自动管理上下文。这已成为AI代理工程师的核心使命。

典型陷阱案例

考虑常见代理模式:

  1. 分解任务为多个子模块
  2. 启动子代理处理子任务
  3. 最终合并结果

[多代理架构缺陷示意图

这种对并行任务极具吸引力的架构实则异常脆弱。关键故障点在于:

任务:“开发Flappy Bird克隆版”
子任务1:“创建含绿色管道和碰撞箱的动态背景”
子任务2:“构建可上下移动的小鸟”
实际执行

  • 子代理1误解需求,构建了超级马里奥式背景
  • 子代理2开发的小鸟不符合游戏美术风格
  • 主代理被迫整合两个冲突结果

现实任务往往存在多层语义 nuance(细微差别),极易引发理解偏差。若仅向子代理传递原始任务上下文仍不足解决——生产系统中对话常为多轮交互,且任务分解过程涉及工具调用等复杂决策。


▍两大核心原则实践

原则1:共享完整上下文轨迹

[上下文共享架构

共享完整代理执行轨迹,而非单条消息

改进后架构确保每个代理获取前置上下文。但在Flappy Bird案例中仍可能出现视觉风格冲突:子代理1与子代理2无法感知彼此进展,导致产出不兼容。

原则2:行为承载隐式决策

每个行为隐含决策,冲突决策引发系统崩溃

当子代理基于未声明的冲突假设行动时,系统必然失控。这两条原则如此关键,任何违反它们的架构都应默认排除。遵循原则的最简方案是单线程线性代理

[单线程代理架构

此架构保持上下文连续性,但面对超长任务链时可能超出上下文窗口限制:

[上下文溢出问题

高阶解决方案

[上下文压缩架构

引入专用于压缩历史记录的LLM,将行动与对话提炼为关键事件与决策。此方案需深度定制:

  • 设计信息提取逻辑
  • 针对领域微调小模型(Cognition已实践) 虽能扩展上下文容量,但仍存在极限。突破任意长上下文管理是值得探索的深坑。

▍现实世界应用案例

[实际应用场景

构建代理时需确保每个行动都基于系统全部相关决策上下文。理想情况下应全局可见,但受限于上下文窗口与现实权衡,需在可靠性与复杂度间取得平衡。

标杆实践解析

Claude Code子代理系统(2025)

  • 仅创建问答型子代理,禁止并行编码
  • 子代理无法获取主代理完整编码上下文
  • 精简设计避免冲突响应

编辑应用模型(2024)

  • 早期方案:大模型输出Markdown编辑说明 → 小模型重写文件
  • 致命缺陷:小模型易误解细微歧义
  • 现代方案:单模型直接决策并执行编辑

▍多代理架构的幻象

[多代理协作困境

试图通过代理”对话”实现并行如同空中楼阁:

  • 人类工程师能高效协商合并冲突(需高智能支撑)
  • 现有代理缺乏长上下文主动协商能力 [3] [4]
  • 2025年现状:多代理协作→系统脆弱性
  • 决策分散化上下文传递不彻底是核心瓶颈

突破点在于:当单线程代理的人机交互足够成熟时,跨代理协作将自然涌现。届时将释放真正的并行效能。


▍通往通用理论之路

上下文工程仅是代理构建标准化的起点,更多挑战犹存:

  • Cognition内部工具链已嵌入这些原则
  • 保持理论灵活性:领域仍在快速演进
  • 诚邀体验我们的实践成果:app.devin.ai
  • 共建代理未来:[email protected]

技术演进的本质,是在混沌中提炼永恒的设计晶体。当上下文成为新氧份,代理生态才能自由呼吸。

原文:https://cognition.ai/blog/dont-build-multi-agents#principles-of-context-engineering

获取更多AI设计灵感
👉 关注公众号 「设计小站」(ID:sjxz00)
▸ 前沿趋势 ▸ 效率工具 ▸ 创意案例