ElasticSearch深度探索：ANNS基于图的NSW与HNSW算法揭秘

这篇文章距离上次修改已过205天，其中的内容可能已经有所变动。

什么是ANNS：为什么不用暴力搜索？
基于图的ANNS简介：NSW与HNSW原理概览
Lucene在ElasticSearch中的HNSW实现机制
HNSW vs Brute-force vs IVF：性能对比与适用场景
如何在ElasticSearch中启用HNSW向量索引
实战代码：构建、查询与调优HNSW索引
可视化图解：HNSW分层结构演示
深度调优技巧：层数、连接度与精度控制
总结：为何HNSW是ElasticSearch未来的向量引擎核心

第一章：什么是ANNS？

1.1 为什么不直接用暴力搜索？

向量相似度检索问题：输入一个向量 q，从百万甚至上亿个高维向量中找出与它“最相近”的前K个。

暴力方法（Brute-force）：

import numpy as np

def brute_force_search(query, vectors, k):
    similarities = [np.dot(query, v) for v in vectors]
    return np.argsort(similarities)[-k:]

但在真实系统中，这种方法的问题是：

计算量为 O(n × d)
不可扩展（延迟、资源消耗高）
大规模服务时无法满足响应时间要求

1.2 ANNS（近似最近邻搜索）

ANNS 是一类算法，牺牲部分精度来换取大幅加速。常见方法：

LSH（局部敏感哈希）
PQ（乘积量化）
IVF（倒排文件索引）
HNSW（基于图的近似搜索）

在Elasticsearch 8.x 之后，官方默认支持的是 HNSW，因为它综合性能表现最好。

第二章：基于图的ANNS简介：NSW与HNSW原理概览

2.1 NSW（Navigable Small World）

NSW 是一种小世界图结构：

节点通过边随机连接；
图中存在高效的“导航路径”；
查询从随机节点出发，按相似度跳转，直到局部最优；

优点：

无需遍历所有节点；
图结构构建灵活；
查询成本远低于线性搜索。

2.2 HNSW（Hierarchical NSW）

HNSW 是 NSW 的多层扩展版本，使用“金字塔结构”提升导航效率。

HNSW 的关键特点：

节点存在多个层级；
最顶层连接较稀疏，底层连接更密集；
查询从高层向下逐层搜索，精度逐步提升；
构建时采用随机概率决定节点层数（幂律分布）。

2.3 HNSW图结构图解（文字描述）

Level 2      A — B
             |   |
Level 1    C — D — E
           |    \  |
Level 0  F — G — H — I

查询从B开始（Level 2）
找到接近的C（Level 1），再往下跳转
最终在Level 0中进入最精细的搜索路径

第三章：Lucene在ElasticSearch中的HNSW实现机制

Elasticsearch 使用的是 Lucene 9.x+ 提供的 HNSW 向量索引。

3.1 索引字段配置

"mappings": {
  "properties": {
    "embedding": {
      "type": "dense_vector",
      "dims": 768,
      "index": true,
      "similarity": "cosine",
      "index_options": {
        "type": "hnsw",
        "m": 16,
        "ef_construction": 128
      }
    }
  }
}

参数解释：

m: 每个点的最大边数（邻居数）
ef_construction: 构建图时的探索宽度，越大越精确但耗时越多

3.2 查询时的参数

"knn": {
  "field": "embedding",
  "query_vector": [...],
  "k": 5,
  "num_candidates": 100
}

k: 返回最近的 k 个向量
num_candidates: 搜索时考虑的候选向量数量，越大越准确

第四章：HNSW vs Brute-force vs IVF：性能对比与适用场景

技术	精度	查询时间	构建时间	适用场景
Brute-force	100%	慢	快	小规模，精确需求
IVF	中等	快	中等	矢量聚类明确时
HNSW	高	快	较慢	通用向量检索

Elasticsearch 中使用的 HNSW 适合：

向量数量：10万 \~ 1000万
实时性要求中等
不可提前聚类或归一化的语义向量场景

第五章：如何在ElasticSearch中启用HNSW向量索引

5.1 安装与准备

Elasticsearch 8.0+ 原生支持 HNSW，无需安装插件。

5.2 创建索引

PUT /hnsw-index
{
  "mappings": {
    "properties": {
      "embedding": {
        "type": "dense_vector",
        "dims": 384,
        "index": true,
        "similarity": "cosine",
        "index_options": {
          "type": "hnsw",
          "m": 16,
          "ef_construction": 128
        }
      }
    }
  }
}

5.3 向索引写入向量数据

from elasticsearch import Elasticsearch
es = Elasticsearch("http://localhost:9200")

vec = [0.1, 0.3, 0.2, ..., 0.5]

es.index(index="hnsw-index", body={
    "id": "doc-1",
    "text": "示例文本",
    "embedding": vec
})

第六章：实战代码：构建、查询与调优HNSW索引

6.1 示例数据生成与入库

from sentence_transformers import SentenceTransformer
import uuid

model = SentenceTransformer("all-MiniLM-L6-v2")

texts = ["苹果是一种水果", "乔布斯创建了苹果公司", "香蕉是黄色的"]

for text in texts:
    vec = model.encode(text).tolist()
    es.index(index="hnsw-index", id=str(uuid.uuid4()), body={
        "text": text,
        "embedding": vec
    })

6.2 向量查询（Top-K搜索）

q = model.encode("苹果公司")  # 查询向量

res = es.search(index="hnsw-index", body={
    "knn": {
        "field": "embedding",
        "query_vector": q.tolist(),
        "k": 2,
        "num_candidates": 100
    }
})

for hit in res['hits']['hits']:
    print(hit['_source']['text'], hit['_score'])

第七章：可视化图解：HNSW分层结构演示（文字）

Level 3:       [A]----[B]
               |       |
Level 2:     [C]----[D]----[E]
               |       |
Level 1:   [F]----[G]----[H]
               |       |
Level 0: [I]--[J]--[K]--[L]

层数越高：节点连接越稀疏，用于快速粗定位；
底层：连接更密集，用于精准比对；
查询路径：从顶层 → 层层向下 → 局部最优搜索；

图结构可以通过开源工具如 Faiss Viewer、HNSWlib可视化。

第八章：深度调优技巧：层数、连接度与精度控制

参数	默认值	建议范围	描述
m	16	8 - 64	邻居数量，越大图越密
ef\_construction	128	100 - 512	图构建时探索宽度
num\_candidates	100	100 - 1000	查询时考虑候选数
similarity	cosine	-	可选 dot\_product

8.1 精度提升建议

提高 num_candidates，能显著提升 Top-K 召回率；
提高 ef_construction，构建更连通的图结构；
向量归一化处理，可提升余弦相似度准确性；

8.2 内存与存储考虑

HNSW 会比Brute-force消耗更多内存（图结构需常驻内存）。建议：

仅对热数据启用HNSW；
冷数据使用粗粒度索引或FAISS离线比对。

总结

特性	HNSW 表现
查询速度	非常快（\~ms）
精度	非常高（接近Brute-force）
内存占用	中等偏高
构建复杂度	中等偏高
适合场景	文档、图像、嵌入式语义检索

Elasticsearch 已将 HNSW 作为其未来向量检索的核心引擎，是构建高性能语义检索与 RAG 系统的理想选择。掌握其原理与调优手段，将帮助你构建更稳定、更快速、更智能的向量化搜索平台。