什么是人工智能 Agent?
人工智能 Agent 是一种能够与自身环境进行交互、收集数据并利用这些数据执行自主任务的软件程序,旨在实现既定目标。虽然目标由人类设定,但 AI Agent 会独立选择实现这些目标所需执行的最佳行动。
让我们来看一个例子:假设有一个客户支持 AI Agent,它的目标是解决客户查询。该 Agent 会自动向客户提问,查阅内部文档中的信息,并据此回复解决方案。根据客户的回答,它会判断是可以自行解决查询,还是需要将其转交给人工处理。
AI Agent 的主要特征
- 自主性: 无需持续的人工输入即可行动,并根据过往数据决定后续步骤,就像书店机器人标记缺失的发票一样。
- 目标导向: 优化既定目标,例如物流 AI 平衡速度、成本和燃料使用。
–感知能力: 从传感器、输入端或 API 收集信息,例如跟踪新威胁的网络安全 Agent。
- 适应性: 当情况发生变化时调整策略。
- 协作性: 与人类或其他 Agent 一起努力实现共同目标,例如与患者和医生协调的医疗 Agent。
AI Agent 如何工作?
1. 角色设定: 每个 Agent 都会被赋予一个清晰定义的角色、个性和沟通风格,以及具体的指令和关于其可用工具的描述。精心设计的角色设定能确保 Agent 的行为与其角色保持一致和恰当,同时随着经验的积累以及与用户或其他系统的互动而不断进化。
2. 记忆: Agent 通常拥有多种类型的记忆:
- 短期记忆,用于当前的交互
- 长期记忆,用于存储历史数据和对话
- 情景记忆,用于回忆具体的过往事件
- 共识记忆,用于在多个 Agent 之间共享知识
记忆使 Agent 能够保持上下文,从经验中学习,并随着时间的推移调整其行为。
3. 工具: 这些是 Agent 可以用来访问信息、处理数据、控制设备或连接其他系统的功能或外部资源。工具可能涉及物理接口、图形用户界面 (UI) 或编程式 API。根据其自身的能力和上下文,Agent 还会学习有效使用这些工具的方式和时机。
4. 模型: Agent 使用大语言模型 (LLM) 作为其“大脑”。LLM 负责解释指令、推理解决方案、生成语言,并编排包括记忆检索和工具使用在内的其他组件来执行任务。
AI Agent 的架构
在 AI Agent 架构中,主要有四个核心组件:
- 分析模块: 该模块帮助 Agent 理解其角色和目的。它从环境中收集信息以形成感知。例如:自动驾驶汽车使用传感器和摄像头来检测障碍物。
- 记忆模块: 记忆模块使 Agent 能够存储和检索过去的经验。这有助于 Agent 从先前的行动中学习并随时间推移不断改进。例如:聊天机器人记住过去的对话以给出更好的回复。
- 规划模块: 该模块负责决策。它评估情况,权衡备选方案,并选择最有效的行动方案。例如:下棋 AI 根据未来的可能性规划其步骤。
- 行动模块: 行动模块将规划模块做出的决策在现实世界中执行。它将决策转化为现实世界的行动。例如:扫地机器人在检测到脏污后移动以清洁指定区域。
AI Agent 分类
Agent 是一种旨在感知环境、做出决策并采取行动以实现特定目标的系统。Agent 在没有直接人工控制的情况下自主运行,可根据其行为、环境和交互 Agent 的数量进行分类。
- 反应式 Agent: 仅对即时的环境刺激做出响应,而没有远见或计划。
- 主动式 Agent: 预测未来状态并计划行动以实现长期目标。
- 单 Agent 系统: 一个 Agent 独立解决问题。
- 多 Agent 系统: 多个 Agent 交互、协调或竞争以实现目标;可能是同构的(角色相似)或异构的(角色多样)。
- 理性 Agent: 利用当前和历史信息选择行动以最大化预期结果。
Agent 的类型
1. 简单反射 Agent
!simple简单反射 Agent 工作原理
简单反射 Agent 仅使用条件-行动规则,完全基于当前的感知进行行动。这些 Agent 会