这篇文章主要讲什么？|读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。开篇

Q: 这篇文章主要讲什么？|读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。 开篇

术语不清，架构就会乱 做 A

AI新闻

Agent 术语表：把智能体黑话一次讲清

3小时前6 阅读

读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。开篇：术语不清，架构就会乱做 Agent 项目，最怕的不是不会调模型。最怕的是概念混在一起。把 RAG 当记忆，把工具调用当 MCP，把 Handof

读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。

开篇：术语不清，架构就会乱

做 Agent 项目，最怕的不是不会调模型。

最怕的是概念混在一起。把 RAG 当记忆，把工具调用当 MCP，把 Handoff 当 A2A，把评估当监控。概念一乱，架构就乱。

这一章不讲复杂理论，只把高频术语讲清楚。每个词都用工程语言解释：它是什么，解决什么问题，放在系统哪一层。

一、先记住这条主线

Agent 不是一个模型。Agent 是一套运行系统。

模型负责理解和生成。上下文负责告诉模型该看什么。检索负责补资料。工具负责做动作。记忆负责保存状态。编排负责控制流程。护栏和评估负责让系统可上线。

一句话：LLM 是大脑，Agent 是大脑加手脚、记忆、流程和安全边界。

公式可以这样记：

Agent = LLM + Context + Tools + Memory + Planning + Guardrails + Evaluation

二、基础层：每天都会碰到的词

Prompt：提示词。你给模型的任务说明。写得越清楚，模型越容易稳定输出。

System Prompt：系统提示。它定义模型角色、边界、格式、禁止事项，优先级高于普通用户输入。

Context Window：上下文窗口。模型一次能读取的信息容量。不是越大越好，关键是放进去的信息是否有用。

Token：模型处理文本的基本单位。成本、长度、速度，很多都和 token 有关。

Structured Output：结构化输出。让模型按 JSON、表单、字段格式输出，方便后续程序解析。

Grounding：事实锚定。让模型回答时依赖可验证资料，而不是凭印象生成。RAG 是常见做法。

三、模型层：大脑是怎么来的

Transformer 是现代大语言模型的核心架构，靠注意力机制处理长文本关系。

Embedding 把文本变成向量。它让机器可以计算“这句话和那段资料像不像”。RAG、推荐、相似搜索都离不开它。

Fine-tuning 是微调。用专用数据让模型更适合某类任务。它不是万能药，很多企业场景先做 RAG 更划算。

Alignment 是对齐。让模型输出更符合人类偏好和安全要求，常见方法包括 RLHF、DPO 等。

MoE 是专家混合架构。不是所有参数每次都参与计算，而是由路由器选择部分专家处理，目标是降低推理成本。

四、知识层：让模型带着资料回答

RAG 的核心是“先检索，再生成”。用户提问后，系统先从知识库找相关资料，再把资料塞进上下文，让模型基于资料回答。

Chunk 是文档切片。文档太长，不能整篇塞给模型，需要按段落、标题、语义切成小块。

Vector DB 是向量数据库。它负责存储和查询 embedding，用来找语义相近的文档片段。

Rerank 是重排序。第一次检索找候选，重排序再把最相关的内容排到前面。

Citation 是引用。回答要能指出来自哪份文档、哪一段，方便用户验证。

五、行动层：让 Agent 真的能做事

Tool Use 是工具使用。模型判断需要外部能力时，调用函数、API、数据库、搜索、文件系统。

Function Calling 是函数调用。它把模型输出变成可执行的函数名和参数，让程序可以安全调用。

MCP 是模型上下文协议。可以理解成 AI 应用连接工具、数据和工作流的标准接口。它不是某一个工具，而是一套连接方式。

Tool Contract 是工具契约。包括工具名、用途、入参、出参、错误码、权限和审计规则。工具契约越清楚，Agent 越稳定。

六、编排层：让流程能跑起来

Planning 是规划。把大目标拆成小步骤。没有规划，Agent 容易一边做一边忘。

Routing 是路由。判断问题该交给哪个工具、哪个流程、哪个 Agent。

Memory 是记忆。它保存用户偏好、任务状态、历史事实。注意：Memory 不是 RAG。RAG 是查资料，Memory 是记住状态。

Handoff 是转交。一个 Agent 遇到自己不擅长的任务，把它交给另一个专业 Agent。

A2A 是智能体间通信协议。它解决的是不同系统、不同框架的 Agent 如何发现彼此、交互和协作。

七、生产层：能不能上线，看这些词

Guardrails 是护栏。它不是一个单点能力，而是一组限制：输入检查、权限控制、工具白名单、输出过滤、敏感信息保护。

HITL 是人类参与。高风险动作前暂停，让人审批。例如付款、删除数据、生产变更、发送正式邮件。

Evaluation 是评估。上线前或变更后，用测试集验证质量是否变好。

Monitoring 是监控。上线后持续看延迟、成本、错误率、调用量、用户反馈。

Trace 是轨迹。记录一次 Agent 执行中的模型调用、工具调用、路由、检索、异常和最终输出。没有 Trace，就很难排查问题。

Prompt Injection 是提示词注入。攻击者通过输入诱导模型忽略规则、泄露信息或错误调用工具。Agent 越能干，越要防这个。

八、小案例：内部知识库问答 Agent

用户问：“订单系统限流策略怎么配置？”

系统先把问题转成 Prompt。然后根据用户身份和历史会话组装 Context。接着用 Embedding 去向量库找相关文档，这一步是 RAG。

如果检索结果不够，Routing 会判断是否需要调用搜索工具或工单系统。工具返回后，模型基于资料生成结构化答案，并附上引用。

最后，Guardrails 检查是否泄露内部密钥，Trace 记录完整链路，Evaluation 用测试集评估答案质量。

这就是术语真正的用法：不是背定义，而是看它在系统链路中承担什么职责。

九、工程上怎么用这张术语表

看一个 Agent 架构时，先问四个问题。

第一，它有没有清楚的目标和流程？如果没有，补 Planning 和 Routing。

第二，它有没有真实资料来源？如果没有，补 RAG、引用和事实锚定。

第三，它有没有行动能力？如果没有，补 Tool Use、函数调用和工具契约。

第四，它能不能上线？如果不能，补 Guardrails、HITL、Trace、Evaluation 和 Monitoring。

把术语放回架构里，它就不再是黑话，而是工程检查项。

总结

Agent 的术语很多，但底层逻辑并不复杂。

模型负责思考，RAG 负责找资料，工具负责做动作，记忆负责保存状态，编排负责控制流程，护栏和评估负责稳定上线。

如果你能把这些词放进一条完整链路里，就真正看懂了 Agent 架构。下一步，不是继续背概念，而是用这些概念去拆业务系统。

要点速读

读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。开篇：术语不清，架构就会乱做 A

读懂术语，不是为了显得专业，而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力
开篇：术语不清，架构就会乱做 A
更多细节仍在持续更新中