在ElasticSearch中,分片是数据的容器,负责存储部分数据和执行操作。分片的数量在索引创建时确定,后续不能更改。分片的分配策略决定了数据如何在不同的分片之间分布,以及如何在集群中的不同节点上分配。
设计目标:
- 均衡性:确保数据均匀分布在所有分片中。
- 可用性:一部分分片不可用时,其余分片仍可提供服务。
- 扩展性:能够在集群增加节点时水平扩展。
- 负载均衡:不同节点负载均衡。
- 故障排除:节点失败时,能够重新分配分片。
执行策略:
- 基于Elasticsearch版本和配置,Elasticsearch会使用不同的分片分配策略。
- 在Elasticsearch 5.x及更早版本中,使用的是
org.elasticsearch.cluster.routing.allocation.decider.ReplicaShardAllocationFilter
。 - 在Elasticsearch 6.x及以后版本中,引入了资源平衡(Resource Balancer)和分片裁决者(Shard Allocation Deciders),以提供更高级的控制和更好的自动平衡。
代码示例(Elasticsearch 7.x及以后版本):
PUT /_cluster/settings
{
"persistent": {
"cluster.routing.allocation.enable": "all",
"cluster.routing.allocation.balance.shard": 0.45,
"cluster.routing.allocation.balance.index": 0.55,
"cluster.routing.allocation.balance.threshold": 1.0
}
}
在这个例子中,我们设置了集群的一些分片分配配置,包括启用分片分配(cluster.routing.allocation.enable
),设置分片平衡因子(cluster.routing.allocation.balance.shard
),以及其他相关的平衡配置。这些配置可以帮助Elasticsearch做出更优的分片分配决策。