Agent 术语表:把智能体黑话一次讲清
读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。 开篇:术语不清,架构就会乱 做 Agent 项目,最怕的不是不会调模型。 最怕的是概念混在一起。把 RAG 当记忆,把工具调用当 MCP,把 Handof
读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。
开篇:术语不清,架构就会乱
做 Agent 项目,最怕的不是不会调模型。
最怕的是概念混在一起。把 RAG 当记忆,把工具调用当 MCP,把 Handoff 当 A2A,把评估当监控。概念一乱,架构就乱。
这一章不讲复杂理论,只把高频术语讲清楚。每个词都用工程语言解释:它是什么,解决什么问题,放在系统哪一层。
一、先记住这条主线
Agent 不是一个模型。Agent 是一套运行系统。
模型负责理解和生成。上下文负责告诉模型该看什么。检索负责补资料。工具负责做动作。记忆负责保存状态。编排负责控制流程。护栏和评估负责让系统可上线。
一句话:LLM 是大脑,Agent 是大脑加手脚、记忆、流程和安全边界。
公式可以这样记:
Agent = LLM + Context + Tools + Memory + Planning + Guardrails + Evaluation
二、基础层:每天都会碰到的词
Prompt:提示词。你给模型的任务说明。写得越清楚,模型越容易稳定输出。
System Prompt:系统提示。它定义模型角色、边界、格式、禁止事项,优先级高于普通用户输入。
Context Window:上下文窗口。模型一次能读取的信息容量。不是越大越好,关键是放进去的信息是否有用。
Token:模型处理文本的基本单位。成本、长度、速度,很多都和 token 有关。
Structured Output:结构化输出。让模型按 JSON、表单、字段格式输出,方便后续程序解析。
Grounding:事实锚定。让模型回答时依赖可验证资料,而不是凭印象生成。RAG 是常见做法。
三、模型层:大脑是怎么来的
Transformer 是现代大语言模型的核心架构,靠注意力机制处理长文本关系。
Embedding 把文本变成向量。它让机器可以计算“这句话和那段资料像不像”。RAG、推荐、相似搜索都离不开它。
Fine-tuning 是微调。用专用数据让模型更适合某类任务。它不是万能药,很多企业场景先做 RAG 更划算。
Alignment 是对齐。让模型输出更符合人类偏好和安全要求,常见方法包括 RLHF、DPO 等。
MoE 是专家混合架构。不是所有参数每次都参与计算,而是由路由器选择部分专家处理,目标是降低推理成本。
四、知识层:让模型带着资料回答
RAG 的核心是“先检索,再生成”。用户提问后,系统先从知识库找相关资料,再把资料塞进上下文,让模型基于资料回答。
Chunk 是文档切片。文档太长,不能整篇塞给模型,需要按段落、标题、语义切成小块。
Vector DB 是向量数据库。它负责存储和查询 embedding,用来找语义相近的文档片段。
Rerank 是重排序。第一次检索找候选,重排序再把最相关的内容排到前面。
Citation 是引用。回答要能指出来自哪份文档、哪一段,方便用户验证。
五、行动层:让 Agent 真的能做事
Tool Use 是工具使用。模型判断需要外部能力时,调用函数、API、数据库、搜索、文件系统。
Function Calling 是函数调用。它把模型输出变成可执行的函数名和参数,让程序可以安全调用。
MCP 是模型上下文协议。可以理解成 AI 应用连接工具、数据和工作流的标准接口。它不是某一个工具,而是一套连接方式。
Tool Contract 是工具契约。包括工具名、用途、入参、出参、错误码、权限和审计规则。工具契约越清楚,Agent 越稳定。
六、编排层:让流程能跑起来
Planning 是规划。把大目标拆成小步骤。没有规划,Agent 容易一边做一边忘。
Routing 是路由。判断问题该交给哪个工具、哪个流程、哪个 Agent。
Memory 是记忆。它保存用户偏好、任务状态、历史事实。注意:Memory 不是 RAG。RAG 是查资料,Memory 是记住状态。
Handoff 是转交。一个 Agent 遇到自己不擅长的任务,把它交给另一个专业 Agent。
A2A 是智能体间通信协议。它解决的是不同系统、不同框架的 Agent 如何发现彼此、交互和协作。
七、生产层:能不能上线,看这些词
Guardrails 是护栏。它不是一个单点能力,而是一组限制:输入检查、权限控制、工具白名单、输出过滤、敏感信息保护。
HITL 是人类参与。高风险动作前暂停,让人审批。例如付款、删除数据、生产变更、发送正式邮件。
Evaluation 是评估。上线前或变更后,用测试集验证质量是否变好。
Monitoring 是监控。上线后持续看延迟、成本、错误率、调用量、用户反馈。
Trace 是轨迹。记录一次 Agent 执行中的模型调用、工具调用、路由、检索、异常和最终输出。没有 Trace,就很难排查问题。
Prompt Injection 是提示词注入。攻击者通过输入诱导模型忽略规则、泄露信息或错误调用工具。Agent 越能干,越要防这个。
八、小案例:内部知识库问答 Agent
用户问:“订单系统限流策略怎么配置?”
系统先把问题转成 Prompt。然后根据用户身份和历史会话组装 Context。接着用 Embedding 去向量库找相关文档,这一步是 RAG。
如果检索结果不够,Routing 会判断是否需要调用搜索工具或工单系统。工具返回后,模型基于资料生成结构化答案,并附上引用。
最后,Guardrails 检查是否泄露内部密钥,Trace 记录完整链路,Evaluation 用测试集评估答案质量。
这就是术语真正的用法:不是背定义,而是看它在系统链路中承担什么职责。
九、工程上怎么用这张术语表
看一个 Agent 架构时,先问四个问题。
第一,它有没有清楚的目标和流程?如果没有,补 Planning 和 Routing。
第二,它有没有真实资料来源?如果没有,补 RAG、引用和事实锚定。
第三,它有没有行动能力?如果没有,补 Tool Use、函数调用和工具契约。
第四,它能不能上线?如果不能,补 Guardrails、HITL、Trace、Evaluation 和 Monitoring。
把术语放回架构里,它就不再是黑话,而是工程检查项。
总结
Agent 的术语很多,但底层逻辑并不复杂。
模型负责思考,RAG 负责找资料,工具负责做动作,记忆负责保存状态,编排负责控制流程,护栏和评估负责稳定上线。
如果你能把这些词放进一条完整链路里,就真正看懂了 Agent 架构。下一步,不是继续背概念,而是用这些概念去拆业务系统。
要点速读
读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。 开篇:术语不清,架构就会乱 做 A
- 读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力
- 开篇:术语不清,架构就会乱 做 A
- 更多细节仍在持续更新中