热闻岛
返回全网热点

Agent 术语表:把智能体黑话一次讲清

3小时前6 阅读
Agent 术语表:把智能体黑话一次讲清配图
读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。 开篇:术语不清,架构就会乱 做 Agent 项目,最怕的不是不会调模型。 最怕的是概念混在一起。把 RAG 当记忆,把工具调用当 MCP,把 Handof
Agent 术语表:把智能体黑话一次讲清配图

读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。

开篇:术语不清,架构就会乱

做 Agent 项目,最怕的不是不会调模型。

最怕的是概念混在一起。把 RAG 当记忆,把工具调用当 MCP,把 Handoff 当 A2A,把评估当监控。概念一乱,架构就乱。

这一章不讲复杂理论,只把高频术语讲清楚。每个词都用工程语言解释:它是什么,解决什么问题,放在系统哪一层。

Agent 术语表:把智能体黑话一次讲清配图

一、先记住这条主线

Agent 不是一个模型。Agent 是一套运行系统。

模型负责理解和生成。上下文负责告诉模型该看什么。检索负责补资料。工具负责做动作。记忆负责保存状态。编排负责控制流程。护栏和评估负责让系统可上线。

一句话:LLM 是大脑,Agent 是大脑加手脚、记忆、流程和安全边界。

公式可以这样记:

Agent = LLM + Context + Tools + Memory + Planning + Guardrails + Evaluation

Agent 术语表:把智能体黑话一次讲清配图

二、基础层:每天都会碰到的词

Prompt:提示词。你给模型的任务说明。写得越清楚,模型越容易稳定输出。

System Prompt:系统提示。它定义模型角色、边界、格式、禁止事项,优先级高于普通用户输入。

Context Window:上下文窗口。模型一次能读取的信息容量。不是越大越好,关键是放进去的信息是否有用。

Token:模型处理文本的基本单位。成本、长度、速度,很多都和 token 有关。

Structured Output:结构化输出。让模型按 JSON、表单、字段格式输出,方便后续程序解析。

Grounding:事实锚定。让模型回答时依赖可验证资料,而不是凭印象生成。RAG 是常见做法。

三、模型层:大脑是怎么来的

Transformer 是现代大语言模型的核心架构,靠注意力机制处理长文本关系。

Embedding 把文本变成向量。它让机器可以计算“这句话和那段资料像不像”。RAG、推荐、相似搜索都离不开它。

Fine-tuning 是微调。用专用数据让模型更适合某类任务。它不是万能药,很多企业场景先做 RAG 更划算。

Alignment 是对齐。让模型输出更符合人类偏好和安全要求,常见方法包括 RLHF、DPO 等。

MoE 是专家混合架构。不是所有参数每次都参与计算,而是由路由器选择部分专家处理,目标是降低推理成本。

四、知识层:让模型带着资料回答

RAG 的核心是“先检索,再生成”。用户提问后,系统先从知识库找相关资料,再把资料塞进上下文,让模型基于资料回答。

Chunk 是文档切片。文档太长,不能整篇塞给模型,需要按段落、标题、语义切成小块。

Vector DB 是向量数据库。它负责存储和查询 embedding,用来找语义相近的文档片段。

Rerank 是重排序。第一次检索找候选,重排序再把最相关的内容排到前面。

Citation 是引用。回答要能指出来自哪份文档、哪一段,方便用户验证。

五、行动层:让 Agent 真的能做事

Tool Use 是工具使用。模型判断需要外部能力时,调用函数、API、数据库、搜索、文件系统。

Function Calling 是函数调用。它把模型输出变成可执行的函数名和参数,让程序可以安全调用。

MCP 是模型上下文协议。可以理解成 AI 应用连接工具、数据和工作流的标准接口。它不是某一个工具,而是一套连接方式。

Tool Contract 是工具契约。包括工具名、用途、入参、出参、错误码、权限和审计规则。工具契约越清楚,Agent 越稳定。

Agent 术语表:把智能体黑话一次讲清配图

六、编排层:让流程能跑起来

Planning 是规划。把大目标拆成小步骤。没有规划,Agent 容易一边做一边忘。

Routing 是路由。判断问题该交给哪个工具、哪个流程、哪个 Agent。

Memory 是记忆。它保存用户偏好、任务状态、历史事实。注意:Memory 不是 RAG。RAG 是查资料,Memory 是记住状态。

Handoff 是转交。一个 Agent 遇到自己不擅长的任务,把它交给另一个专业 Agent。

A2A 是智能体间通信协议。它解决的是不同系统、不同框架的 Agent 如何发现彼此、交互和协作。

七、生产层:能不能上线,看这些词

Guardrails 是护栏。它不是一个单点能力,而是一组限制:输入检查、权限控制、工具白名单、输出过滤、敏感信息保护。

HITL 是人类参与。高风险动作前暂停,让人审批。例如付款、删除数据、生产变更、发送正式邮件。

Evaluation 是评估。上线前或变更后,用测试集验证质量是否变好。

Monitoring 是监控。上线后持续看延迟、成本、错误率、调用量、用户反馈。

Trace 是轨迹。记录一次 Agent 执行中的模型调用、工具调用、路由、检索、异常和最终输出。没有 Trace,就很难排查问题。

Prompt Injection 是提示词注入。攻击者通过输入诱导模型忽略规则、泄露信息或错误调用工具。Agent 越能干,越要防这个。

Agent 术语表:把智能体黑话一次讲清配图

八、小案例:内部知识库问答 Agent

用户问:“订单系统限流策略怎么配置?”

系统先把问题转成 Prompt。然后根据用户身份和历史会话组装 Context。接着用 Embedding 去向量库找相关文档,这一步是 RAG。

如果检索结果不够,Routing 会判断是否需要调用搜索工具或工单系统。工具返回后,模型基于资料生成结构化答案,并附上引用。

最后,Guardrails 检查是否泄露内部密钥,Trace 记录完整链路,Evaluation 用测试集评估答案质量。

这就是术语真正的用法:不是背定义,而是看它在系统链路中承担什么职责。

Agent 术语表:把智能体黑话一次讲清配图

九、工程上怎么用这张术语表

看一个 Agent 架构时,先问四个问题。

第一,它有没有清楚的目标和流程?如果没有,补 Planning 和 Routing。

第二,它有没有真实资料来源?如果没有,补 RAG、引用和事实锚定。

第三,它有没有行动能力?如果没有,补 Tool Use、函数调用和工具契约。

第四,它能不能上线?如果不能,补 Guardrails、HITL、Trace、Evaluation 和 Monitoring。

把术语放回架构里,它就不再是黑话,而是工程检查项。

Agent 术语表:把智能体黑话一次讲清配图

总结

Agent 的术语很多,但底层逻辑并不复杂。

模型负责思考,RAG 负责找资料,工具负责做动作,记忆负责保存状态,编排负责控制流程,护栏和评估负责稳定上线。

如果你能把这些词放进一条完整链路里,就真正看懂了 Agent 架构。下一步,不是继续背概念,而是用这些概念去拆业务系统。

要点速读

读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力。 开篇:术语不清,架构就会乱 做 A

  • 读懂术语,不是为了显得专业,而是为了能看懂架构、能拆清模块、能判断系统缺哪一层能力
  • 开篇:术语不清,架构就会乱 做 A
  • 更多细节仍在持续更新中