《步子哥的技术工作坊》关于 AI Agent 的深度讲解
AI Agent 是一个具备自主决策、任务规划和执行能力的智能实体。它不仅能理解用户输入(像传统 LLM 那样生成文本),还能根据任务目标主动推理、规划并调用工具或执行动作。
感知(Sense) → 推理(Think) → 行动(Act)

原理:将推理和行动交织进行,Agent 在每一步中同时进行思考(推理)和执行(行动)。
适用场景:实时性要求高的任务,如简单的问答、即时工具调用。
优点:
- 响应速度快
- 适合简单任务或单步决策
缺点:
- 对复杂任务可能缺乏全局规划
- 容易陷入局部最优
原理:先制定全局任务计划,将复杂任务拆解为多个子任务,再按计划逐步执行。
适用场景:需要多阶段协调的复杂任务,如项目管理、代码生成、自动化工作流。
优点:
- 适合复杂任务
- 规划清晰,容错性强
缺点:
- 规划阶段可能耗时较长
- 需额外设计状态管理

Prompt 是 Agent 的”大脑”,用于引导 LLM 进行推理和规划。
1. 分析用户输入,明确任务目标。
2. 如果需要工具,列出可用的工具并选择合适的工具。
3. 推理下一步行动,说明理由。
4. 执行行动或生成最终答案。
可用的工具:[search_web, calculate, write_file]
用户输入:{{user_input}}
输出格式:
– 推理:{你的推理过程}
– 行动:{具体行动或工具调用}
– 结果:{最终输出}
定义一组工具函数,供 Agent 调用。
# 模拟调用搜索 API
return f”搜索结果 for {query}: 模拟数据…”
def calculate(expression):
# 简单计算器
return eval(expression)
def write_file(content, filename):
with open(filename, ‘w’) as f:
f.write(content)
return f”文件 {filename} 已保存”
使用 Python 实现一个简单的 Agent 主循环,结合 LLM API 和工具调用。
def __init__(self):
self.tools = {
“search_web”: search_web,
“calculate”: calculate,
“write_file”: write_file
}
self.memory = [] # 短期记忆
def process(self, user_input: str) -> str:
# 构造 Prompt
# 调用 LLM
# 解析 LLM 输出
# 执行行动
return f”推理:{reasoning}\n行动:{action}\n结果:{result}”

即使没有微服务体系,也可以通过模块化设计(分离 Prompt、工具、状态管理)实现清晰的架构。使用 Python 的类或函数模块化代码,方便扩展和维护。
设计多轮交互逻辑,允许用户随时调整任务目标。支持”继续上一步”、”撤销”或”重新规划”等指令。
通过《步子哥的技术工作坊》的讲解,我们可以清晰理解 AI Agent 的核心概念(自主决策、任务执行)和两种主流构建模式(ReAct 和 Plan-and-Execute)。实现一个简化版 Claude Code 需要整合 Prompt 模板、工具函数、推理逻辑和状态管理,Python 是一个不错的起点。希望以上内容能帮助你从原理到实战,快速构建一个属于自己的 Agent!
从简单的 ReAct 模式开始,逐步尝试 Plan-and-Execute 模式,通过实际项目加深对 AI Agent 的理解和应用。


