Milvus 向量数据库 专栏导览

专栏定位

本专栏聚焦 Milvus 向量数据库的架构设计与相似度检索原理——从 ANN(近似最近邻)问题的定义和向量索引算法(IVF/HNSW/DiskANN),到 Milvus 的存算分离云原生架构和混合检索能力。随着大语言模型(LLM)和 RAG(检索增强生成)的兴起,向量数据库成为 AI 基础设施的关键组件——理解其索引算法和查询引擎的设计,是构建高质量 RAG 系统的前提。

目标读者

  • 构建 RAG/推荐/搜索系统需要使用向量数据库的 AI/后端工程师
  • 需要在 Milvus/Pinecone/Weaviate/Qdrant 之间做选型的架构师
  • 对 ANN 算法和向量索引设计感兴趣的技术爱好者

专栏目录

序号标题核心内容
0101 Milvus 全局架构——存算分离与云原生设计Access Layer/Coordinator/Worker/Storage 四层架构、与传统数据库的核心差异、向量检索的业务场景(推荐/搜索/RAG)
0202 向量索引——从暴力搜索到 HNSW 与 IVFANN 问题的定义、IVF-FLAT/IVF-PQ 的量化压缩、HNSW 的分层可导航小世界图、DiskANN 的磁盘索引、索引选型的 Recall-QPS 权衡
0303 数据模型——Collection、Partition 与 SegmentSchema 定义(向量字段/标量字段)、Segment 的 Growing → Sealed → Flushed 状态机、数据导入的批量与流式接口
0404 查询引擎——混合检索与过滤纯向量检索 vs 标量过滤 + 向量检索的两种策略、Expr 表达式过滤引擎、Range Search 与 Group By、多向量字段检索
0505 Milvus 在 RAG 场景中的应用Embedding 模型的选型、文档分块策略、向量 + 关键词混合检索、与 LangChain/LlamaIndex 的集成、Reranker 的二次排序
0606 Milvus 运维——集群部署、索引调优与容量规划Helm/Operator 部署、索引构建参数调优(nlist/nprobe/ef)、内存与磁盘的容量估算、Attu 可视化管理工具

推荐阅读路径

核心原理路径:01 → 02 → 03 → 04

应用实践路径:05 → 06

前置知识

  • 线性代数基础(向量、距离度量:欧式距离/余弦相似度/内积)
  • 建议了解 LLM 和 Embedding 的基本概念(有助于理解 RAG 场景)

关联专栏

  • LLM 原理:Embedding 模型与向量检索的理论基础
  • Agent 开发:RAG Pipeline 中 Milvus 作为向量存储
  • Elasticsearch:全文搜索 vs 向量搜索的场景对比
  • etcd:Milvus 使用 etcd 做元数据管理