智能体( Agent )是一种能够自主感知环境并采取行动以实现特定目标的实体,在这一实现中需要依赖规划、记忆以及工具等关键模块,而 LLM 充当「大脑」的角色,将所有模块串联起来。

Overview of a LLM-powered autonomous agent system

一个智能体框架通常包含以下部分

模块作用
用户请求表达用户的问题或请求
智能体/大脑作为协调者的智能体核心
规划模块助于智能体为未来行动做规划
记忆模块管理智能体的历史行为和经验

智能体/大脑

基于 LLM 构建的「大脑」,负责协调其他各个模块的运行,通过设计一个 含有操作方法和可用工具详细信息的提示模板 来启动这个组件。

尽管不强制,但我们还是可以为智能体设定一个具体角色或者塑造一个人格,以明确其职能。这种设定通常包含在提示中,涵盖角色详情、性格、社交及人口统计等信息。

规划模块

规划模块的作用是将「用户请求」拆分成「智能体」能够单独解决的若干个步骤或子任务,这对于智能体能够更准确地理解问题和找到可靠的解决方案至关重要。

无反馈规划

规划模块将借助 LLM 拆分出详尽的计划,包括解答用户问题所需的子任务。常见的任务分解技术包括思维链思维树,它们分别代表了单路径推理和多路径推理。

有反馈规划

为了应对解决复杂任务时面临的长期规划挑战,可以采取有反馈的规划技术,让模型基于过去的行动和观察迭代地反思和调整执行计划。其目的是纠正过去的错误并提升结果质量,这在处理复杂的现实任务时尤其关键,其中 试错法是解决问题的关键步骤

种著名的反思或评估机制方法包括 ReAct 和 Reflexion。

TODO 内存/记忆模块

TODO 工具

Refs