Agent 开发技术 专栏导览

专栏定位

本专栏聚焦 基于大语言模型的 Agent 开发技术——从 Prompt 工程和 RAG(检索增强生成),到 MCP(Model Context Protocol)标准化工具协议、Agent 架构设计(ReAct/Reflexion/LATS/Plan-and-Execute)、Agent 记忆体系,再到多 Agent 协作(A2A 协议)和 Agent 框架选型(LangGraph/CrewAI/OpenAI Agents SDK/AutoGen)。

Agent 是 LLM 从”文本生成工具”进化为”自主决策执行体”的关键技术——它赋予模型**感知环境(Perception)、推理规划(Reasoning & Planning)、调用工具(Tool Calling)、自我反思(Reflection)和持续记忆(Memory)**的能力。2024-2025 年是 Agent 技术的爆发期——MCP 协议标准化了 Agent 与工具的连接方式,A2A 协议标准化了 Agent 之间的通信方式,LangGraph v1.0 成为状态图编排的事实标准,Agent 从原型走向生产。

本专栏侧重工程实践,以主流框架为载体,结合 Milvus 向量数据库、MCP/A2A 协议等基础设施,构建生产级的 Agent 应用。

目标读者

  • 正在用 LLM API 构建智能应用(客服/知识库/自动化/编程助手)的后端/AI 工程师
  • 需要设计 RAG 系统、Agent 架构或多 Agent 编排的技术负责人
  • 对 Agent 框架、MCP 生态和 LLM 应用开发感兴趣的全栈开发者

专栏目录

序号标题核心内容
0101 Prompt 工程——从零样本到思维链Zero-Shot/Few-Shot Prompting、Chain-of-Thought(CoT)思维链推理、Self-Consistency 自一致性、Tree-of-Thought 思维树、System Prompt 的角色设定与输出格式控制、Structured Output(JSON Mode)、Prompt 注入攻击与防御
0202 RAG 架构——检索增强生成的完整链路RAG 的核心动机(解决幻觉/时效性/领域知识)、文档加载→分块→Embedding→向量检索→Rerank→生成的完整 Pipeline、分块策略(固定/语义/递归)、Embedding 模型选型、Milvus 向量数据库的应用、评估指标(Faithfulness/Relevance/Recall)
0303 高级 RAG——从 Naive RAG 到 Agentic RAGNaive RAG 的局限(检索质量/上下文窗口/多跳推理)、Query 改写与 HyDE(假设文档嵌入)、Self-RAG 的自适应检索、Multi-Query RAG 的并行检索、Graph RAG 的知识图谱增强、Corrective RAG 的检索质量校验、Agentic RAG 的动态路由与工具选择
0404 MCP 协议深度解析——Agent 与工具的标准化连接MCP 的设计动机(“AI 的 USB-C”——统一 LLM 与外部系统的集成)、MCP 架构(Host/Client/Server 三层)、三大核心能力(Tools 工具调用/Resources 数据资源/Prompts 提示模板)、JSON-RPC 2.0 传输层、MCP Server 开发实战、MCP 与 Function Calling 的关系与区别、Anthropic 捐赠 MCP 给 Linux Foundation AAIF 的生态意义
0505 Agent 核心能力——推理、规划与工具调用Agent 的核心循环(感知 → 推理 → 行动 → 观察)、推理能力(Reasoning)的重要性、五种规划方法(任务分解/多计划选择/外部模块辅助/反思修正/记忆增强)、ReAct(Reasoning + Acting)的交替推理、Reflexion 的自我反思与经验积累、LATS(Language Agent Tree Search)的蒙特卡洛树搜索、Plan-and-Execute 的分步执行、PLaG(Plan Like a Graph)的并行任务图
0606 Agent 记忆体系——从短期缓冲到长期知识记忆在 Agent 中的核心地位、短期记忆(对话上下文窗口/Sliding Window)、工作记忆(Scratchpad/中间推理结果)、长期记忆(向量数据库持久化/Summary Memory)、情景记忆(Episode Memory——成功/失败经验的结构化存储)、记忆的检索与遗忘机制、MemGPT 的虚拟内存分页思想、记忆在 Agent 自我改进中的作用
0707 Agent 框架选型——LangGraph、CrewAI、OpenAI Agents SDK 与 AutoGenLangGraph v1.0 的状态图编排(State/Node/Edge/Conditional Edge/Persistence)、CrewAI 的角色-任务-流程范式、OpenAI Agents SDK 的托管运行时(内置工具/Handoff/Guardrails)、AutoGen 的多轮对话协作、LlamaIndex Agents 的 RAG-First 设计、框架选型的决策矩阵(复杂度/控制力/生态/学习曲线)
0808 多 Agent 系统与 A2A 协议——协作、分工与互操作多 Agent 的设计动机(专业化分工/并行执行/对抗性验证)、Supervisor(中心化编排)vs Decentralized(去中心化协作)架构、Google A2A(Agent-to-Agent)协议的设计(Agent Card/Task/Message/Streaming)、MCP 与 A2A 的互补关系(MCP 连接工具,A2A 连接 Agent)、多 Agent 的调试与可观测性
0909 Agent 应用实战——从知识库助手到自动化工作流企业知识库 Agent 的完整实现(文档解析/向量化/对话式检索/权限控制)、代码生成 Agent(Sandbox 执行/测试验证/迭代修复)、数据分析 Agent(SQL 生成/图表渲染/自然语言交互)、自动化工作流 Agent(MCP Server 集成邮件/日历/CRM/数据库)、生产部署的安全与监控
1010 Agent 评估与可靠性——幻觉检测、安全防护与成本控制Agent 的评估框架(任务完成率/工具调用准确率/推理链正确性/端到端成功率)、幻觉检测与 Grounding(基于检索的事实校验)、Guardrails 的输入/输出过滤(NeMo Guardrails/Anthropic Constitutional AI)、Prompt 注入与越狱防御、Token 成本优化(Semantic Caching/模型路由/Prompt 压缩)、Agent 的可观测性(LangSmith/Arize/OpenTelemetry)

推荐阅读路径

RAG 路径:01 → 02 → 03

Agent 核心路径:04 → 05 → 06

框架与多 Agent 路径:07 → 08

实战与可靠性路径:09 → 10

前置知识

  • 建议先阅读 LLM 原理 专栏了解 Transformer 和 LLM 的基本工作原理
  • Python 编程和 REST API 调用
  • 建议了解 Milvus 向量数据库(RAG 的核心组件)

关联专栏

  • LLM 原理:Transformer 和 LLM 的基础原理
  • Milvus:RAG 场景的向量检索引擎
  • Elasticsearch:RAG 场景的文本检索引擎
  • Redis:Agent 的会话缓存与状态存储