这篇文章主要讲什么？|开篇

AI新闻

Agent 常见问题 FAQ

20小时前10 阅读

开篇：学完模式后，最重要的是会判断前面已经讲完了 Agent 的核心模式：提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。但真正落地时，开发者最常问的不是“概念是什么”，而是：这个需求

开篇：学完模式后，最重要的是会判断

前面已经讲完了 Agent 的核心模式：提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。

但真正落地时，开发者最常问的不是“概念是什么”，而是：这个需求到底要不要做 Agent？哪些模式先上？怎么避免越做越复杂？怎么判断能不能上线？

一、Agent 到底和普通大模型应用有什么区别？

Q：只接一个大模型 API，算 Agent 吗？

A：通常不算。普通大模型应用主要是“输入问题，输出答案”。Agent 更像一个带流程的执行系统：能理解目标，保持状态，选择工具，调用外部系统，观察结果，并继续下一步。

Q：RAG 算 Agent 吗？

A：RAG 本身不是 Agent。RAG 负责“查资料后回答”。如果系统还能根据任务选择检索策略、调用业务工具、继续追问、处理失败、进入审批流程，才更接近 Agent。

Q：那一句话怎么判断？

A：看它有没有“行动闭环”。如果只是回答，就是 LLM/RAG；如果能围绕目标持续执行、调用工具、处理反馈，就是 Agent。

二、什么时候不要做 Agent？

很多项目失败，不是因为模型弱，而是因为一开始就把简单问题做复杂了。

需求路径固定：例如“抽取字段 -> 转 JSON -> 入库”，用提示链和代码工作流即可。

没有外部动作：只是总结、改写、分类，不需要工具和状态。

结果必须高度确定：例如财务入账、权限变更，核心流程应该由代码掌控，模型只做辅助判断。

评估标准不清楚：不知道成功标准，就不要让 Agent 自主执行。

一句话：Agent 是为复杂任务准备的，不是为了显得高级。Anthropic 在构建有效 Agent 的文章中也强调，应先寻找最简单可行方案，只在简单方案不够时增加复杂度。

三、哪些模式应该先学会？

不要一次把所有模式都塞进系统。更稳的方式是按问题逐层加。

最小可落地组合通常是：路由 + RAG + 工具 + 评估监控。复杂后再加规划、反思、记忆、多智能体。

四、工具、技能、MCP、A2A 到底怎么分？

这几个词最容易混。可以这样理解：

Q：工具和技能有什么区别？

A：工具更像一个外部能力，比如查订单、发邮件、查天气。技能更像一组已经编排好的能力，比如“处理退款”，里面可能包含查订单、查支付、判断规则、发通知。

Q：MCP 和工具调用有什么区别？

A：工具调用强调模型怎么调用某个函数；MCP 更像工具接入标准，把文件、数据库、内部系统包装成统一接口，让不同 Agent 更容易复用。

Q：A2A 和 MCP 有什么区别？

A：MCP 主要解决 Agent 和工具之间怎么连接；A2A 主要解决 Agent 和 Agent 之间怎么委托、协作、传递任务。

五、多智能体是不是一定更强？

不一定。多智能体不是“人多力量大”，而是“分工清楚才有用”。

适合多智能体：任务需要多角色、多视角、多工具域，例如代码审查、投研分析、复杂客服。

不适合多智能体：任务简单、路径固定、上下文短，一个 Agent 就能处理。

最大问题：通信成本高、上下文变长、责任边界不清、调试更难。

好的多智能体系统，通常有一个协调者。它负责拆任务、派发、收集结果、处理冲突。不是让一群 Agent 自由聊天。

六、记忆会不会越多越好？

Q：Agent 记住越多，效果越好吗？

A：不是。记忆越多，噪声也越多。真正要记的是任务状态、用户偏好、长期事实和历史决策。临时闲聊、敏感信息、过期信息都不应该乱记。

Q：RAG 和 Memory 怎么分？

A：RAG 是查外部知识；Memory 是维护用户和任务上下文。一个是知识来源，一个是状态管理。企业知识库用 RAG，用户长期偏好和任务进度用 Memory。

七、Agent 怎么判断能不能上线？

上线标准不是“模型回答看起来不错”。而是要看完整链路是否可控。

结果是否能评估：任务成功率、准确率、召回率、人工满意度。

过程是否能追踪：模型输入输出、工具调用、路由选择、审批记录。

失败是否能恢复：超时、工具异常、检索为空、输出格式错误。

成本是否可控：模型费用、工具费用、延迟、并发压力。

风险是否有边界：提示注入、越权、敏感信息、危险工具调用。

OpenAI Agents SDK 的 tracing 会记录模型生成、工具调用、handoff、guardrails 等事件；LangGraph 也强调持久化、人工介入、记忆和可观测性。这些能力不是锦上添花，而是 Agent 进生产的基础。

八、一个需求怎么从普通 AI 应用升级成 Agent？

以企业内部知识库问答为例。不要直接上复杂 Agent。按四步升级更稳。

第一步，先做普通问答，验证用户是否真的需要。

第二步，加 RAG，解决内部资料缺失。

第三步，加工具，能查工单、查系统、查权限。第四步，加护栏、审批、评估、监控，才进入可上线 Agent。

九、开发者最容易踩的坑

一上来就多智能体，结果调试困难。

工具描述不清，模型经常调错工具。

没有权限控制，Agent 能访问不该访问的数据。

没有轨迹日志，出问题无法复盘。

没有评估集，每次改提示词都靠感觉。

没有人工审批，高风险动作直接自动执行。

记忆乱存，导致隐私风险和上下文污染。

十、最后给一个落地公式

一个能上线的 Agent，不是“一个大模型 + 很长的 Prompt”。它应该是：

Agent = 目标 + 状态 + 工具 + 知识 + 规划 + 护栏 + 评估 + 监控

目标决定它要做什么。状态决定它做到哪一步。工具决定它能不能行动。知识决定它回答有没有依据。规划决定它能不能处理复杂任务。护栏决定它会不会越界。评估和监控决定它能不能持续上线。

真正的 Agent 工程，不是让模型更自由，而是让模型在清晰边界内把事办成。

要点速读

开篇：学完模式后，最重要的是会判断前面已经讲完了 Agent 的核心模式：提示链、路由、并行化、反思、工具使用、规划、

开篇：学完模式后，最重要的是会判断前面已经讲完了 Agent 的核心模式：提示链、路由、并行化、反思、工具使用、规划、
更多细节仍在持续更新中
更多细节仍在持续更新中