Milvus 向量数据库 专栏导览
专栏定位
本专栏聚焦 Milvus 向量数据库的架构设计与相似度检索原理——从 ANN(近似最近邻)问题的定义和向量索引算法(IVF/HNSW/DiskANN),到 Milvus 的存算分离云原生架构和混合检索能力。随着大语言模型(LLM)和 RAG(检索增强生成)的兴起,向量数据库成为 AI 基础设施的关键组件——理解其索引算法和查询引擎的设计,是构建高质量 RAG 系统的前提。
目标读者
- 构建 RAG/推荐/搜索系统需要使用向量数据库的 AI/后端工程师
- 需要在 Milvus/Pinecone/Weaviate/Qdrant 之间做选型的架构师
- 对 ANN 算法和向量索引设计感兴趣的技术爱好者
专栏目录
| 序号 | 标题 | 核心内容 |
|---|---|---|
| 01 | 01 Milvus 全局架构——存算分离与云原生设计 | Access Layer/Coordinator/Worker/Storage 四层架构、与传统数据库的核心差异、向量检索的业务场景(推荐/搜索/RAG) |
| 02 | 02 向量索引——从暴力搜索到 HNSW 与 IVF | ANN 问题的定义、IVF-FLAT/IVF-PQ 的量化压缩、HNSW 的分层可导航小世界图、DiskANN 的磁盘索引、索引选型的 Recall-QPS 权衡 |
| 03 | 03 数据模型——Collection、Partition 与 Segment | Schema 定义(向量字段/标量字段)、Segment 的 Growing → Sealed → Flushed 状态机、数据导入的批量与流式接口 |
| 04 | 04 查询引擎——混合检索与过滤 | 纯向量检索 vs 标量过滤 + 向量检索的两种策略、Expr 表达式过滤引擎、Range Search 与 Group By、多向量字段检索 |
| 05 | 05 Milvus 在 RAG 场景中的应用 | Embedding 模型的选型、文档分块策略、向量 + 关键词混合检索、与 LangChain/LlamaIndex 的集成、Reranker 的二次排序 |
| 06 | 06 Milvus 运维——集群部署、索引调优与容量规划 | Helm/Operator 部署、索引构建参数调优(nlist/nprobe/ef)、内存与磁盘的容量估算、Attu 可视化管理工具 |
推荐阅读路径
核心原理路径:01 → 02 → 03 → 04
应用实践路径:05 → 06
前置知识
- 线性代数基础(向量、距离度量:欧式距离/余弦相似度/内积)
- 建议了解 LLM 和 Embedding 的基本概念(有助于理解 RAG 场景)
关联专栏
- LLM 原理:Embedding 模型与向量检索的理论基础
- Agent 开发:RAG Pipeline 中 Milvus 作为向量存储
- Elasticsearch:全文搜索 vs 向量搜索的场景对比
- etcd:Milvus 使用 etcd 做元数据管理