Agent开发

青夢2026-02-112026-06-24

后端转 Agent 开发

Agent（智能体）设计结构

项目目录结构

agent-project/
├── 01_planner/ 规划与任务管理
│   ├── goal.md
│   ├── plan.md
│   ├── task-breakdown.md
│   └── roadmap.md
├── 02_memory/ 记忆系统
│   ├── long-term-memory.md
│   ├── short-term-memory.md
│   ├── entity-memory.md
│   └── knowledge-graph.md
├── 03_tools/ 工具系统
│   ├── api-tools/
│   │   ├── search.md
│   │   ├── weather.md
│   │   ├── calculator.md
│   │   └── news.md
│   ├── code-tools/
│   │   ├── code-executor.md
│   │   ├── file-reader.md
│   │   └── terminal.md
│   └── custom-tools/
│       ├── db-query.md
│       ├── notion.md
│       └── slack.md
├── 04_knowledge/ 知识库与检索
│   ├── documents/
│   ├── embeddings/
│   ├── vector-store.md
│   ├── rag-pipeline.md
│   └── index-strategy.md
├── 05_agent_core/ Agent核心配置
│   ├── agent.md
│   ├── roles.md
│   ├── persona.md
│   ├── workflow.md
│   ├── system-prompt.md
│   └── prompt-template.md
├── 06_evaluation/ 评估与测试
│   ├── eval-metrics/
│   ├── test-cases.md
│   ├── benchmarks.md
│   └── result-analysis.md
├── 07_observability/ 观测与监控
│   ├── logs/
│   ├── traces.md
│   ├── monitoring.md
│   └── alert-rules.md
├── 08_deployment/ 部署与运维
│   ├── docker/
│   ├── k8s/
│   ├── deploy.md
│   └── env.example
├── 09_examples/ 示例与用例
│   ├── use-cases/
│   └── demo-flows.md
└── 10_docs/ 文档与知识库

模块说明

01 规划与任务管理

定义目标、拆解任务、制定执行计划，明确 Agent 的方向与分阶段任务。

02 记忆系统

管理不同类型的记忆（短期、长期、实体），
支持上下文持续与个性化记忆。

03 工具系统

集成各类可调用工具（API、代码、自定义），
扩展 Agent 的能力边界。

04 知识库与检索

构建知识库并实现高效检索，支持 RAG 流程，
提升回答的准确性与可靠性。

05 Agent核心配置

配置 Agent 角色、人格、系统提示词等核心要素，
定义工作流与 Prompt 模板。

06 评估与测试

制定评估指标与测试用例，持续评估 Agent 表现，
驱动优化迭代。

07 观测与监控

记录与监控 Agent 的运行状态、性能与异常，
保障稳定运行。

08 部署与运维

负责配置、环境管理、容器化与 CI/CD，
保障发布与运维效率。

09 示例与用例

提供典型场景、流程示例与 Prompt 示例，
帮助快速上手与复用。

10 文档与知识库

沉淀架构设计、最佳实践、FAQ 与版本记录，
形成团队知识库。

一、架构设计

设计原则

模块化（职责清晰，易于扩展）
可迭代（持续优化，快速反馈）
可观测（全链路监控与告警）
安全可控（权限控制，数据保护）
可复用（沉淀资产，提升效率）

Agent 工作流

1. Query（用户输入的任务）
   用户提出问题或下达指令
        ↓
2. 请求 LLM <--更新prompt--> historys（历史记录） 
   将 Query + 历史上下文 发送给大模型
        ↓
3. LLM 思考与决策（生成中间步骤）---> 调用 Functions 库（预约会议/取消会议/查找文档...）
   - Thinking：思考：分析问题、理解意图、拆解任务
   - Action：行动：决定调用哪个 Function
   - Action Input：行动输入：生成调用 Function 的参数
        ↓
historys（历史记录）<---更新历史---> 4. Observation（获取结果）<--- 调用 Functions 库（预约会议/取消会议/查找文档...）
   Function 调用执行，返回结果给 Agent
        ↓
5. Final Answer（输出最终结果）
   整合信息，生成 Task 最终答案
        ↓
交互展现
   - 智能卡片结果：结构化、可视化结果展示
   - 自然语言结果：自然语言回复用户问题

图例说明

Query：用户提出任务
LLM：理解与决策核心
Thinking：分析思考
Action：选择要调用的工具
Action Input：构造参数
Functions 库：可调用能力集合
Observation：执行结果反馈
Final Answer：生成最终答案
交互展现：以卡片或自然语言输出

流程要点

while True:
	(1 接收任务 → 2 请求LLM → 3 决策步骤 → 4 调用工具 → 5 获取结果 → 6 输出答案)
	if 生成最终答案:
		break

循环迭代，直到生成最终答案。

二、实现步骤

步骤1：设置环境

除了 Python，我们还需要安装一些必要的库。在本教程中，我们将使用 requests、json 和 termcolor 库。另外，我们会使用 dotenv 来管理环境变量。在命令行中输入 pip install requests termcolor python-dotenv 进行安装。

1	pip install requests termcolor python-dotenv

步骤2：定义模型类

我们首先需要一个能够处理用户输入的模型。我们将创建一个 OllamaModel 类，它通过与本地 API 进行交互来生成响应。以下是基本实现代码：

from termcolor import colored
import os
from dotenv import load_dotenv
import requests
import json
import operator
import re

load_dotenv()

class OllamaModel:
    def __init__(self, model, system_prompt, temperature=0, stop=None):
        """
        用给定的参数初始化 OllamaModel。

        参数:
        model (str): 要使用的模型名称。
        system_prompt (str): 要使用的系统提示。
        temperature (float): 模型的温度设置。
        stop (str): 模型的停止标记。
        """
        self.model_endpoint = os.getenv(
            "OLLAMA_ENDPOINT",
            "http://localhost:11434/api/generate",
        )
        self.temperature = temperature
        self.model = model
        self.system_prompt = system_prompt
        self.headers = {"Content-Type": "application/json"}
        self.stop = stop

    def generate_text(self, prompt):
        """
        将用户输入和系统提示发送给本地 Ollama 服务，并返回模型生成的文本。

        参数:
        prompt (str): 用户输入。

        返回:
        str: 模型返回的文本内容。
        """
        payload = {
            "model": self.model,
            "prompt": f"{self.system_prompt}\n\n用户输入: {prompt}\n\n请按要求输出:",
            "temperature": self.temperature,
            "stream": False,
        }

        if self.stop:
            payload["stop"] = [self.stop] if isinstance(self.stop, str) else self.stop

        response = requests.post(
            self.model_endpoint,
            headers=self.headers,
            data=json.dumps(payload),
            timeout=60,
        )
        response.raise_for_status()

        result = response.json()
        return result.get("response", "").strip()

步骤3：为智能体创建工具

接下来是为我们的智能体创建可用的工具。这些工具是执行特定任务的简单 Python 函数。以下是一个基本计算器和字符串反转器的示例：

def basic_calculator(input_str):
    """
    根据输入字符串或字典对两个数字执行数值运算。

    参数:
    input_str (str或dict): 要么是表示包含'num1'、'num2'和'operation'键的字典的JSON字符串，
    要么是直接的字典。例如: '{"num1": 5, "num2": 3, "operation": "add"}'
    或{"num1": 67869, "num2": 9030393, "operation": "divide"}

    返回:
    str: 运算的格式化结果。

    抛出:
    Exception: 如果在运算过程中发生错误（例如，除以零）。
    ValueError: 如果请求了不支持的运算或输入无效。
    """

    try:
        if isinstance(input_str, dict):
            input_dict = input_str
        else:
            input_str_clean = input_str.replace("'", "\"")
            input_str_clean = input_str_clean.strip().strip("\"")
            input_dict = json.loads(input_str_clean)
        if not all(key in input_dict for key in ['num1', 'num2', 'operation']):
            return "Error: Input must contain 'num1', 'num2', and 'operation'."
        num1 = float(input_dict['num1'])
        num2 = float(input_dict['num2'])
        operation = input_dict['operation'].lower()
    except (json.JSONDecodeError, KeyError) as e:
        return "Invalid input format. Please provide valid numbers and operation."
    except ValueError as e:
        return "Error: Please provide valid numerical values."

    operations = {
        'add': operator.add,
        'plus': operator.add,
        'subtract': operator.sub,
        'minus': operator.sub,
        'multiply': operator.mul,
        'times': operator.mul,
        'divide': operator.truediv,
        'floor_divide': operator.floordiv,
        'mod': operator.mod,
        'power': operator.pow,
    }

    if operation not in operations:
        return f"Error: Unsupported operation '{operation}'."

    if operation in ['divide', 'floor_divide', 'mod'] and num2 == 0:
        return "Error: Division by zero is not allowed."

    try:
        result = operations[operation](num1, num2)
        return f"Result: {result}"
    except Exception as e:
        return f"Error during calculation: {str(e)}"


def reverse_string(input_str):
    """
    反转输入文本。

    参数:
    input_str (str或dict): 要反转的文本，或包含 text/input/tool_input 字段的字典。

    返回:
    str: 反转后的文本。
    """
    if isinstance(input_str, dict):
        text = (
            input_str.get("text")
            or input_str.get("input")
            or input_str.get("tool_input")
            or ""
        )
    else:
        text = str(input_str)

    text = text.strip()

    # 兼容模型把完整请求当作 tool_input 返回的情况。
    text = re.sub(r"^(can you\s+)?reverse( the word)?( of)?\s+", "", text, flags=re.I)
    text = text.strip().strip("?").strip()
    text = text.strip("'\"")

    return text[::-1]

步骤4：构建工具箱

ToolBox 类用于存储智能体可以使用的所有工具，并为每个工具提供描述：

class ToolBox:
    def __init__(self):
        self.tools_dict = {}

    def store(self, functions_list):
        """
        存储列表中每个函数的名称和文档字符串。
        参数:
        functions_list (list): 要存储的函数对象列表。
        返回:
        dict: 以函数名称为键，其文档字符串为值的字典。
        """
        for func in functions_list:
            self.tools_dict[func.__name__] = func.__doc__
        return self.tools_dict

    def tools(self):
        """
        将store方法中创建的字典转换为文本字符串返回。
        返回:
        str: 存储的函数及其文档字符串的字典，以文本字符串形式返回。
        """
        tools_str = ""
        for name, doc in self.tools_dict.items():
            tools_str += f"{name}: \"{doc}\"\n"
        return tools_str.strip()

这个类将帮助智能体了解哪些工具可用以及每个工具的用途。

步骤5：创建智能体类

智能体需要进行思考、决定使用哪个工具并执行它。以下是 Agent 类的代码：

AGENT_SYSTEM_PROMPT = """
你是一个工具路由型 AI Agent。你的任务是理解用户请求，决定是否需要调用工具，并输出严格的 JSON。

可用工具:

1. basic_calculator: 用于数学运算
   - 示例输入: "Calculate 15 plus 7"
   - 示例输出: {"tool_choice": "basic_calculator", "tool_input": {"num1": 15, "num2": 7, "operation": "plus"}}
   - 示例输入: "What is 100 divided by 5?"
   - 示例输出: {"tool_choice": "basic_calculator", "tool_input": {"num1": 100, "num2": 5, "operation": "divide"}}

2. reverse_string: 用于文本反转
   - 示例输入: "Reverse of 'Howwww'?"
   - 示例输出: {"tool_choice": "reverse_string", "tool_input": "Howwww"}
   - 示例输入: "What is the reverse of Python?"
   - 示例输出: {"tool_choice": "reverse_string", "tool_input": "Python"}

3. no tool: 用于一般对话和问题
   - 示例输入: "Who are you?"
   - 示例输出: {"tool_choice": "no tool", "tool_input": "I am an AI assistant that can answer questions, perform calculations, and reverse text."}
   - 示例输入: "How are you?"
   - 示例输出: {"tool_choice": "no tool", "tool_input": "I'm functioning well and ready to help."}

严格规则:

1. 对于关于身份、能力或感受的问题:
   - 始终使用 "no tool"
   - 提供完整、友好的回复
   - 提及你的能力

2. 对于任何文本反转请求:
   - 始终使用 "reverse_string"
   - 仅提取要反转的文本
   - 去除引号、"reverse of" 和其他多余文本

3. 对于任何数学运算:
   - 始终使用 "basic_calculator"
   - 提取数字和运算
   - 将文本形式的数字转换为数字

下面是你的工具列表及其描述:
{tool_descriptions}

注意:
- 你的回复必须始终是包含 "tool_choice" 和 "tool_input" 字段的有效 JSON。
- 不要输出 Markdown。
- 不要输出解释文字。
"""


class Agent:
    def __init__(self, tools, model_service, model_name, stop=None):
        """
        用工具列表和模型初始化智能体。

        参数:
        tools (list): 可调用工具函数列表。
        model_service (class): 模型服务类，例如 OllamaModel。
        model_name (str): 要使用的模型名称。
        stop (str): 模型停止标记。
        """
        self.tools = tools
        self.tools_map = {tool.__name__: tool for tool in tools}
        self.tool_box = ToolBox()
        self.tool_descriptions = self.prepare_tools()
        self.system_prompt = AGENT_SYSTEM_PROMPT.replace(
            "{tool_descriptions}",
            self.tool_descriptions,
        )
        self.model = model_service(
            model=model_name,
            system_prompt=self.system_prompt,
            temperature=0,
            stop=stop,
        )

    def prepare_tools(self):
        """
        存储工具函数，并返回工具描述文本。
        """
        self.tool_box.store(self.tools)
        return self.tool_box.tools()

    def _extract_json(self, text):
        """
        从模型输出中提取 JSON 对象。

        有些模型会额外输出说明或代码围栏，因此这里做一层容错解析。
        """
        text = text.strip()
        text = text.replace("```json", "").replace("```", "").strip()

        try:
            return json.loads(text)
        except json.JSONDecodeError:
            match = re.search(r"\{.*\}", text, flags=re.S)
            if not match:
                raise ValueError(f"Model did not return JSON: {text}")
            return json.loads(match.group(0))

    def think(self, prompt):
        """
        调用模型，让模型决定工具选择与工具参数。

        参数:
        prompt (str): 用户输入。

        返回:
        dict: 包含 tool_choice 和 tool_input 的决策结果。
        """
        response = self.model.generate_text(prompt)
        decision = self._extract_json(response)

        if "tool_choice" not in decision or "tool_input" not in decision:
            raise ValueError(f"Invalid tool decision: {decision}")

        return decision

    def work(self, prompt):
        """
        执行一次完整 Agent 工作流：思考、选择工具、执行工具、输出结果。

        参数:
        prompt (str): 用户输入。

        返回:
        str: 最终输出。
        """
        try:
            decision = self.think(prompt)
            tool_choice = decision["tool_choice"]
            tool_input = decision["tool_input"]

            print(colored(f"Tool choice: {tool_choice}", "cyan"))
            print(colored(f"Tool input: {tool_input}", "cyan"))

            if tool_choice == "no tool":
                final_answer = str(tool_input)
            else:
                tool = self.tools_map.get(tool_choice)
                if not tool:
                    final_answer = f"Error: Unknown tool '{tool_choice}'."
                else:
                    final_answer = tool(tool_input)

            print(colored(f"Final answer: {final_answer}", "green"))
            return final_answer
        except Exception as e:
            error_message = f"Agent error: {str(e)}"
            print(colored(error_message, "red"))
            return error_message

这个类有三个主要方法：

prepare_tools：存储并返回工具的描述。
think：根据用户提示决定使用哪个工具。
work：执行选择的工具并返回结果。

步骤6：运行智能体

最后，让我们把所有内容整合起来，运行我们的智能体。在脚本的主程序部分，初始化智能体并开始接受用户输入：

if __name__ == "__main__":
    """
    使用此智能体的说明:
    你可以尝试的示例查询:
    1. 计算器运算:
        - "Calculate 15 plus 7"
        - "What is 100 divided by 5?"
        - "Multiply 23 and 4"
    2. 字符串反转:
        - "Reverse the word 'hello world'"
        - "Can you reverse 'Python Programming'?"
    3. 一般问题（将得到直接回复）:
        - "Who are you?"
        - "What can you help me with?"
    Ollama命令（在终端中运行这些命令）:
        - 查看可用模型:      'ollama list'
        - 查看正在运行的模型: 'ps aux | grep ollama'
        - 列出模型标签:      'curl http://localhost:11434/api/tags'
        - 拉取新模型:        'ollama pull mistral'
        - 运行模型服务器:    'ollama serve'
    """
    tools = [basic_calculator, reverse_string]
    model_service = OllamaModel
    model_name = "llama2"
    stop = "<<|eot_id|>"
    agent = Agent(
        tools=tools,
        model_service=model_service,
        model_name=model_name,
        stop=stop,
    )

    print("\nWelcome to the AI Agent! Type 'exit' to quit.")
    print("You can ask me to:")
    print("1. Perform calculations (e.g., 'Calculate 15 plus 7')")
    print("2. Reverse strings (e.g., 'Reverse hello world')")
    print("3. Answer general questions\n")

    while True:
        prompt = input("Ask me anything: ")
        if prompt.lower() == "exit":
            break
        agent.work(prompt)

Agent 记忆系统

Memory
├── 短期记忆
│   └── Redis
│
├── 长期记忆
│   └── PostgreSQL
│
├── 实体记忆
│   └── PostgreSQL
│
├── 情景记忆
│   └── PGVector
│
└── Reflection
    └── Celery定时总结

自建 Memory 选型决策树

是否需要跨会话记忆？
├── 否 → 直接用对话历史数组 [普通聊天/简单客服/单次任务]
└── 是 → 记忆量规模？
    ├── 小（<100 条）[个人助手/小型项目]
    │   → JSON / SQLite 文件存储
    ├── 中（100-10000 条）[企业内部Agent/CRM系统/项目管理系统]
    │   → 结构化数据库PostgreSQL/MySQL/SQLite + 关键词检索/倒排索引
    └── 大（>10000 条）
        → 向量数据库Milvus/Qdrant/Weaviate/PGVector/Chroma + 语义检索

四大通用设计模式

滑动窗口 + 摘要：近期原文保留 + 早期历史压缩 → 绝大多数场景（推荐）
分层记忆：短期对话 + 长期向量检索 + 实体键值存储 → 生产级精准记忆（生产级推荐）
工具驱动记忆：Agent 自主调用工具存 / 取记忆 → 复杂 Agent 自主管理
反思循环：定期分析对话，提取信息存入长期记忆 → 持续沉淀偏好 / 经验

Memory 四大核心分类

短期记忆：单次会话内，上下文消息列表 → 保存当前对话记录
- 仅在当前会话有效/通常存储 Message History/随 Token 窗口滚动淘汰
- 适用于ChatBot/单次问答/简单 Agent
长期记忆：跨会话持久化，外部数据库 / 向量库 → 存储用户偏好、学习经验
- 持久化存储/支持长期检索/用户画像沉淀
- 适用于AI 助手/企业 Copilot/长期陪伴型 Agent
实体记忆：跨会话，结构化存储 → 记录人名、项目名、团队成员等实体
- 适用于CRM Agent/项目管理 Agent/企业知识库 Agent
情景记忆：跨会话，检索式存储 → 记住具体事件（如上次调试 bug 的方法）
- 适用于Coding Agent/运维 Agent/AI 工作流 Agent