热闻岛
返回全网热点

Agent 常见问题 FAQ

20小时前10 阅读
Agent 常见问题 FAQ配图
开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。 但真正落地时,开发者最常问的不是“概念是什么”,而是:这个需求
Agent 常见问题 FAQ配图

开篇:学完模式后,最重要的是会判断

前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、记忆、RAG、多智能体、MCP、A2A、护栏、评估监控。

但真正落地时,开发者最常问的不是“概念是什么”,而是:这个需求到底要不要做 Agent?哪些模式先上?怎么避免越做越复杂?怎么判断能不能上线?

Agent 常见问题 FAQ配图

一、Agent 到底和普通大模型应用有什么区别?

Q:只接一个大模型 API,算 Agent 吗?

A:通常不算。普通大模型应用主要是“输入问题,输出答案”。Agent 更像一个带流程的执行系统:能理解目标,保持状态,选择工具,调用外部系统,观察结果,并继续下一步。

Q:RAG 算 Agent 吗?

A:RAG 本身不是 Agent。RAG 负责“查资料后回答”。如果系统还能根据任务选择检索策略、调用业务工具、继续追问、处理失败、进入审批流程,才更接近 Agent。

Q:那一句话怎么判断?

A:看它有没有“行动闭环”。如果只是回答,就是 LLM/RAG;如果能围绕目标持续执行、调用工具、处理反馈,就是 Agent。

Agent 常见问题 FAQ配图

二、什么时候不要做 Agent?

很多项目失败,不是因为模型弱,而是因为一开始就把简单问题做复杂了。

需求路径固定:例如“抽取字段 -> 转 JSON -> 入库”,用提示链和代码工作流即可。

没有外部动作:只是总结、改写、分类,不需要工具和状态。

结果必须高度确定:例如财务入账、权限变更,核心流程应该由代码掌控,模型只做辅助判断。

评估标准不清楚:不知道成功标准,就不要让 Agent 自主执行。

一句话:Agent 是为复杂任务准备的,不是为了显得高级。Anthropic 在构建有效 Agent 的文章中也强调,应先寻找最简单可行方案,只在简单方案不够时增加复杂度。

三、哪些模式应该先学会?

不要一次把所有模式都塞进系统。更稳的方式是按问题逐层加。

Agent 常见问题 FAQ配图

最小可落地组合通常是:路由 + RAG + 工具 + 评估监控。复杂后再加规划、反思、记忆、多智能体。

四、工具、技能、MCP、A2A 到底怎么分?

这几个词最容易混。可以这样理解:

Agent 常见问题 FAQ配图

Q:工具和技能有什么区别?

A:工具更像一个外部能力,比如查订单、发邮件、查天气。技能更像一组已经编排好的能力,比如“处理退款”,里面可能包含查订单、查支付、判断规则、发通知。

Q:MCP 和工具调用有什么区别?

A:工具调用强调模型怎么调用某个函数;MCP 更像工具接入标准,把文件、数据库、内部系统包装成统一接口,让不同 Agent 更容易复用。

Q:A2A 和 MCP 有什么区别?

A:MCP 主要解决 Agent 和工具之间怎么连接;A2A 主要解决 Agent 和 Agent 之间怎么委托、协作、传递任务。

五、多智能体是不是一定更强?

不一定。多智能体不是“人多力量大”,而是“分工清楚才有用”。

适合多智能体:任务需要多角色、多视角、多工具域,例如代码审查、投研分析、复杂客服。

不适合多智能体:任务简单、路径固定、上下文短,一个 Agent 就能处理。

最大问题:通信成本高、上下文变长、责任边界不清、调试更难。

好的多智能体系统,通常有一个协调者。它负责拆任务、派发、收集结果、处理冲突。不是让一群 Agent 自由聊天。

六、记忆会不会越多越好?

Q:Agent 记住越多,效果越好吗?

A:不是。记忆越多,噪声也越多。真正要记的是任务状态、用户偏好、长期事实和历史决策。临时闲聊、敏感信息、过期信息都不应该乱记。

Q:RAG 和 Memory 怎么分?

A:RAG 是查外部知识;Memory 是维护用户和任务上下文。一个是知识来源,一个是状态管理。企业知识库用 RAG,用户长期偏好和任务进度用 Memory。

七、Agent 怎么判断能不能上线?

上线标准不是“模型回答看起来不错”。而是要看完整链路是否可控。

结果是否能评估:任务成功率、准确率、召回率、人工满意度。

过程是否能追踪:模型输入输出、工具调用、路由选择、审批记录。

失败是否能恢复:超时、工具异常、检索为空、输出格式错误。

成本是否可控:模型费用、工具费用、延迟、并发压力。

风险是否有边界:提示注入、越权、敏感信息、危险工具调用。

OpenAI Agents SDK 的 tracing 会记录模型生成、工具调用、handoff、guardrails 等事件;LangGraph 也强调持久化、人工介入、记忆和可观测性。这些能力不是锦上添花,而是 Agent 进生产的基础。

Agent 常见问题 FAQ配图

八、一个需求怎么从普通 AI 应用升级成 Agent?

以企业内部知识库问答为例。不要直接上复杂 Agent。按四步升级更稳。

Agent 常见问题 FAQ配图

第一步,先做普通问答,验证用户是否真的需要。

第二步,加 RAG,解决内部资料缺失。

第三步,加工具,能查工单、查系统、查权限。第四步,加护栏、审批、评估、监控,才进入可上线 Agent。

九、开发者最容易踩的坑

一上来就多智能体,结果调试困难。

工具描述不清,模型经常调错工具。

没有权限控制,Agent 能访问不该访问的数据。

没有轨迹日志,出问题无法复盘。

没有评估集,每次改提示词都靠感觉。

没有人工审批,高风险动作直接自动执行。

记忆乱存,导致隐私风险和上下文污染。

十、最后给一个落地公式

一个能上线的 Agent,不是“一个大模型 + 很长的 Prompt”。它应该是:

Agent = 目标 + 状态 + 工具 + 知识 + 规划 + 护栏 + 评估 + 监控

目标决定它要做什么。状态决定它做到哪一步。工具决定它能不能行动。知识决定它回答有没有依据。规划决定它能不能处理复杂任务。护栏决定它会不会越界。评估和监控决定它能不能持续上线。

真正的 Agent 工程,不是让模型更自由,而是让模型在清晰边界内把事办成。

要点速读

开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、

  • 开篇:学完模式后,最重要的是会判断 前面已经讲完了 Agent 的核心模式:提示链、路由、并行化、反思、工具使用、规划、
  • 更多细节仍在持续更新中
  • 更多细节仍在持续更新中