Context Engineering:比 Prompt Engineering 更重要的上下文工程
24 / 24 章
一、Prompt 只是入口,上下文才是现场 很多人做 AI 应用,第一反应是改 Prompt。 但线上 Agent 出错,往往不是 Prompt 写得不够玄,而是模型看到的上下文不对。 一句话讲透 Context Engineering,就
一、Prompt 只是入口,上下文才是现场
很多人做 AI 应用,第一反应是改 Prompt。
但线上 Agent 出错,往往不是 Prompt 写得不够玄,而是模型看到的上下文不对。
一句话讲透 Context Engineering,就是把正确的信息、正确的工具、正确的记忆、正确的规则,在正确的时间,放进模型的上下文窗口。 |
Prompt Engineering 解决“怎么说”。
Context Engineering 解决“给模型看什么”。
模型不会看见你的数据库。不会看见你的用户画像。不会自动知道权限。不会自动理解刚刚哪个工具失败了。
这些东西,都要被工程系统组织成上下文。
二、为什么它比 Prompt 更重要?
Prompt 再好,也只是上下文的一部分。
真实应用里,模型看到的是一整包东西:
系统指令
用户问题
历史消息
RAG 检索结果
工具返回结果
短期状态
长期记忆
权限配置
输出格式
这包东西只要乱,模型就会乱。
关键判断 如果回答错了,先不要怪模型。先问:这次模型到底看到了什么? |
三、上下文工程管的不是一件事,而是三类上下文
LangChain 官方把 Agent 上下文分成三个层次。
第一层:Model Context。模型调用时临时看到的东西。
第二层:Tool Context。工具执行时可以读取和写入的东西。
第三层:Life-cycle Context。模型和工具之间发生的治理动作。
这三个层次,决定了 Agent 是不是能上线。
三类上下文:模型看到什么,工具能读写什么,生命周期如何治理。
四、上下文从哪里来?三个数据源
上下文不是凭空出现的。
在 LangChain 里,常见来源是三个:
Runtime Context:本次运行配置,比如 user_id、role、env、api_key。
State:当前线程状态,比如 messages、认证状态、上传文件、工具结果。
Store:长期记忆,比如用户偏好、历史洞察、跨会话资料。
这三个来源组合起来,才是完整的上下文工程。
Runtime Context、State、Store 分别解决不同生命周期的数据问题。
五、上下文最终都会落到这条链路上
从源码看,上下文工程不是一个抽象概念。
它最后会落到 AgentState、ModelRequest、Middleware、ToolRuntime、Store 这些对象上。
把源码链路压缩后,就是下面这条线。
上下文工程的核心源码链路。
六、ModelRequest 是一次模型调用的上下文快照
ModelRequest 很关键。
它不是普通参数对象。
它是一次模型调用前的“上下文快照”。
里面装着:模型、消息、系统指令、工具、输出格式、状态、运行时上下文。
ModelRequest 的精简源码结构。
源码里最值得注意的是 override。
它不是直接修改原请求,而是返回一个新请求。
这意味着:中间件可以临时换模型、换工具、换消息、换输出格式,而不污染原始状态。
源码理解 ModelRequest.override(...) 是上下文工程最常见的动刀口。它让“本次模型调用看到什么”变得可控。 |
七、AgentState 是短期上下文的仓库
AgentState 里最核心的字段是 messages。
它不是普通 list。它带有 add_messages reducer。
这意味着:每次模型返回、工具返回,都会被追加进状态。
精简源码 class AgentState(TypedDict): |
所以,聊天历史为什么能一轮轮延续?
答案就在这里:messages 被状态图持续合并。
但这也带来问题:messages 会越来越长。
所以后面必须有裁剪、摘要、过滤。
八、Middleware 是上下文手术刀
Middleware 让你在 Agent Loop 的关键点动手。
常见钩子有四类:
before_model:模型调用前,适合裁剪消息、注入规则、提前结束。
wrap_model_call:包住模型调用,适合换模型、换工具、换 response_format。
after_model:模型返回后,适合校验输出、拦截敏感内容、决定跳转。
wrap_tool_call:包住工具调用,适合鉴权、重试、脱敏、审计。
Middleware 插在 Agent Loop 内部,控制上下文流动。
工程价值 Middleware 的本质,是把“拼上下文”从散乱业务代码里抽出来,变成可复用、可测试、可审计的工程层。 |
九、动态上下文:不是所有用户都该看到同一套 Prompt 和工具
同一个 Agent,不同用户看到的上下文应该不同。
管理员、普通用户、游客,权限不同。
新用户、老用户、高风险用户,策略不同。
短对话、长对话、复杂任务,模型也可以不同。
这就是动态上下文。
典型做法 用 runtime.context 读取用户角色;用 state 读取会话状态;用 store 读取长期偏好;再通过 ModelRequest.override(...) 改 system_message、tools、model、response_format。 |
工具也一样。
不要把所有工具一次性暴露给模型。
工具越多,模型越容易选错。
正确做法是:按权限、意图、阶段动态筛工具。
十、上下文太长:不是扩上下文窗口,而是管上下文质量
长上下文不等于好上下文。
长上下文会带来四个问题:
成本上升:token 越多,越贵。
延迟上升:输入越长,越慢。
注意力分散:无关信息越多,模型越容易跑偏。
冲突增加:旧信息、新信息、工具信息互相打架。
解决思路不是无限塞,而是选、裁、压、隔离。
上下文压缩的四种常见手段。
十一、SummarizationMiddleware 做的是持久压缩
临时裁剪,只影响这一次模型调用。
摘要中间件不一样。
它会把旧消息压成摘要,并写回 State。
以后每一轮都会看到摘要,而不是原始长历史。
精简源码链路 SummarizationMiddleware |
这就是生命周期上下文。
它不是临时改 ModelRequest。
它会真正改变未来会话的状态。
十二、企业级做法:做一个 Context Builder
生产系统不要到处拼 Prompt。
更好的做法是加一层 Context Builder。
它负责统一收集、筛选、压缩、注入上下文。
这一层应该输出一份干净的 ModelRequest。
里面包括:
任务上下文:当前用户到底要做什么。
身份上下文:用户是谁、权限是什么。
记忆上下文:用户偏好、历史偏好。
知识上下文:RAG 检索到的资料。
工具上下文:工具结果、错误状态。
安全上下文:合规规则、敏感词、风险控制。
输出上下文:结构化输出 Schema。
十三、上下文工程常见坑
上下文工程做不好,Agent 就会看起来“不聪明”。
本质上,是你给它的现场太乱。
十四、总结
最终结论 Prompt 只是上下文的一部分。真正决定 Agent 质量的,是你能否控制模型每一步看到的全部信息。 |
相关推荐

微信支付发布AI工具箱2.0:不仅能听懂 9 国语言,Token消耗还省一半!
微信支付官方近日正式发布了AI接入工具箱2. 0 版本。该版本在 4 月份初代产品的基础上,结合了商家与开发者的实际反馈,围绕安全、高效、原生流畅三大核心方向完成了重大升级。 新版工具箱全面支持中文、英语、日语等 9 种语言,并针对微信支付专属的业务概念进行了原生语义适配。这一改进有效杜绝了机器直译造成的理解偏差,能够帮助全球开发者借助母语无障碍地完成对接工

AI合规再升级:Anthropic拟对全量用户实施身份认证
近日,人工智能领军企业Anthropic通过内部邮件向部分用户通报了 最新 的政策调整:自2026年7月8日起,旗下Claude平台的所有用户,包括免费版、Pro版以及Max版订阅用户,均需完成实名身份认证。 据了解,此次身份认证流程要求用户上传带有照片的政府核发身份证件,并同步进行实时人脸扫描比对,相关数据处理将由第三方认证平台Persona全权负责。对于

OpenAI豪掷1. 5 亿美元:构建全球合作伙伴网络,深耕企业AI落地
在企业界,应用AI的瓶颈早已不再是模型本身的能力,而在于如何将AI与复杂的业务流程深度融合。为了跨越这一障碍,OpenAI于近日正式发布了“OpenAI合作伙伴网络”,并宣布投入1.5亿美元资金,旨在通过生态共建的方式,加速AI解决方案在企业端的规模化应用。 OpenAI的这项宏大计划,本质上是为其全球生态系统注入强心剂。通过与系统集成商、管理咨询公司及技术
激活函数、归一化、Dropout:模型稳定训练的三件套
激活函数,让模型有表达力。归一化,让数值分布稳定。Dropout,让模型别死记。 1. 这三件事分别解决什么问题 第一步,线性层负责“算”。它把输入乘权重、加偏置。 第二步,激活函数负责“拐弯”。没有它,再多层线性层也只是更大的线性层。 第

AI日报:豆包上线任务模式;元宝正式打通ima公开知识库;智谱GLM-5. 2 全量开源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、豆包上线“任务模式”:支持多轮搜索与PPT自动化生成 豆包上线“任务模式”,标志着其从单一文本交互工具向具备复杂工作流处理能力的AI Agent演进,支持多轮搜索、深度推理、浏览器自动化操作以及多模态内容

银行业百万美元年薪争夺首席AI官 IBM调查显示高管设置率一年内激增50%
全球银行业正掀起一场针对首席AI官(CAIO)的高薪争夺战,汇丰控股、澳大利亚联邦银行和劳埃德银行集团的AI领域主管均在过去三个月内密集上任,这一现象正在重塑金融服务业的领航力量。 I BM商业价值研究院对3个国家、21个产业的2000名首席执行官开展的 最新 调查显示,2026年设有首席AI官的组织占比已从2025年的26%急剧飙升至76%。数据研究公司E
阅读补充
一句话看懂
一、Prompt 只是入口,上下文才是现场 很多人做 AI 应用,第一反应是改 Prompt。 但线上 Agent 出错
事件背景
这篇内容围绕“Context”展开,热闻岛基于公开信息整理事件背景、主要进展与可继续关注的方向。
事件时间线
发布
相关信息进入公开传播
更新
热闻岛对内容进行整理与补充。
看点
- · Context的最新进展是什么
- · 相关信息对用户或行业会带来哪些影响
- · 后续是否会有新的回应或处理结果
后续关注
- · 后续官方回应或权威通报
- · 相关主体的进一步说明
- · 事件对普通用户和平台传播的持续影响
免责声明:本文仅代表作者观点,不构成投资建议、法律建议、医疗建议。财经类内容尤其需要注意风险;爆料类信息请以权威通报为准。
评论 (0)
登录后即可发表评论
去登录