Agent 常见问题 FAQ
开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。 但真正落地时,开发者最常问的不是“概念是什么”,而是:这个需求
开篇:学完模式后,最重要的是会判断
前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。
但真正落地时,开发者最常问的不是“概念是什么”,而是:这个需求到底要不要做 Agent?哪些模式先上?怎么避免越做越复杂?怎么判断能不能上线?
一、Agent 到底和普通大模型应用有什么区别?
Q:只接一个大模型 API,算 Agent 吗?
A:通常不算。普通大模型应用主要是“输入问题,输出答案”。Agent 更像一个带流程的执行系统:能理解目标,保持状态,选择工具,调用外部系统,观察结果,并继续下一步。
Q:RAG 算 Agent 吗?
A:RAG 本身不是 Agent。RAG 负责“查资料后回答”。如果系统还能根据任务选择检索策略、调用业务工具、继续追问、处理失败、进入审批流程,才更接近 Agent。
Q:那一句话怎么判断?
A:看它有没有“行动闭环”。如果只是回答,就是 LLM/RAG;如果能围绕目标持续执行、调用工具、处理反馈,就是 Agent。
二、什么时候不要做 Agent?
很多项目失败,不是因为模型弱,而是因为一开始就把简单问题做复杂了。
需求路径固定:例如“抽取字段 -> 转 JSON -> 入库”,用提示链和代码工作流即可。
没有外部动作:只是总结、改写、分类,不需要工具和状态。
结果必须高度确定:例如财务入账、权限变更,核心流程应该由代码掌控,模型只做辅助判断。
评估标准不清楚:不知道成功标准,就不要让 Agent 自主执行。
一句话:Agent 是为复杂任务准备的,不是为了显得高级。Anthropic 在构建有效 Agent 的文章中也强调,应先寻找最简单可行方案,只在简单方案不够时增加复杂度。
三、哪些模式应该先学会?
不要一次把所有模式都塞进系统。更稳的方式是按问题逐层加。
最小可落地组合通常是:路由 + RAG + 工具 + 评估监控。复杂后再加规划、反思、记忆、多智能体。
四、工具、技能、MCP、A2A 到底怎么分?
这几个词最容易混。可以这样理解:
Q:工具和技能有什么区别?
A:工具更像一个外部能力,比如查订单、发邮件、查天气。技能更像一组已经编排好的能力,比如“处理退款”,里面可能包含查订单、查支付、判断规则、发通知。
Q:MCP 和工具调用有什么区别?
A:工具调用强调模型怎么调用某个函数;MCP 更像工具接入标准,把文件、数据库、内部系统包装成统一接口,让不同 Agent 更容易复用。
Q:A2A 和 MCP 有什么区别?
A:MCP 主要解决 Agent 和工具之间怎么连接;A2A 主要解决 Agent 和 Agent 之间怎么委托、协作、传递任务。
五、多智能体是不是一定更强?
不一定。多智能体不是“人多力量大”,而是“分工清楚才有用”。
适合多智能体:任务需要多角色、多视角、多工具域,例如代码审查、投研分析、复杂客服。
不适合多智能体:任务简单、路径固定、上下文短,一个 Agent 就能处理。
最大问题:通信成本高、上下文变长、责任边界不清、调试更难。
好的多智能体系统,通常有一个协调者。它负责拆任务、派发、收集结果、处理冲突。不是让一群 Agent 自由聊天。
六、记忆会不会越多越好?
Q:Agent 记住越多,效果越好吗?
A:不是。记忆越多,噪声也越多。真正要记的是任务状态、用户偏好、长期事实和历史决策。临时闲聊、敏感信息、过期信息都不应该乱记。
Q:RAG 和 Memory 怎么分?
A:RAG 是查外部知识;Memory 是维护用户和任务上下文。一个是知识来源,一个是状态管理。企业知识库用 RAG,用户长期偏好和任务进度用 Memory。
七、Agent 怎么判断能不能上线?
上线标准不是“模型回答看起来不错”。而是要看完整链路是否可控。
结果是否能评估:任务成功率、准确率、召回率、人工满意度。
过程是否能追踪:模型输入输出、工具调用、路由选择、审批记录。
失败是否能恢复:超时、工具异常、检索为空、输出格式错误。
成本是否可控:模型费用、工具费用、延迟、并发压力。
风险是否有边界:提示注入、越权、敏感信息、危险工具调用。
OpenAI Agents SDK 的 tracing 会记录模型生成、工具调用、handoff、guardrails 等事件;LangGraph 也强调持久化、人工介入、记忆和可观测性。这些能力不是锦上添花,而是 Agent 进生产的基础。
八、一个需求怎么从普通 AI 应用升级成 Agent?
以企业内部知识库问答为例。不要直接上复杂 Agent。按四步升级更稳。
第一步,先做普通问答,验证用户是否真的需要。
第二步,加 RAG,解决内部资料缺失。
第三步,加工具,能查工单、查系统、查权限。第四步,加护栏、审批、评估、监控,才进入可上线 Agent。
九、开发者最容易踩的坑
一上来就多智能体,结果调试困难。
工具描述不清,模型经常调错工具。
没有权限控制,Agent 能访问不该访问的数据。
没有轨迹日志,出问题无法复盘。
没有评估集,每次改提示词都靠感觉。
没有人工审批,高风险动作直接自动执行。
记忆乱存,导致隐私风险和上下文污染。
十、最后给一个落地公式
一个能上线的 Agent,不是“一个大模型 + 很长的 Prompt”。它应该是:
Agent = 目标 + 状态 + 工具 + 知识 + 规划 + 护栏 + 评估 + 监控
目标决定它要做什么。状态决定它做到哪一步。工具决定它能不能行动。知识决定它回答有没有依据。规划决定它能不能处理复杂任务。护栏决定它会不会越界。评估和监控决定它能不能持续上线。
真正的 Agent 工程,不是让模型更自由,而是让模型在清晰边界内把事办成。
要点速读
开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、
- 开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、
- 更多细节仍在持续更新中
- 更多细节仍在持续更新中