Elasticsearch 集群架构中分片和副本的作用是什么？

Question

Levenx · Accepted Answer

Elasticsearch 的分布式能力建立在两个核心机制之上：分片（Shard） 和 副本（Replica）。分片解决"一台机器存不下、算不快"的问题，副本解决"一台机器挂了数据丢了"的问题。理解这两者的工作方式，是掌握 Elasticsearch 集群架构的关键。分片（Shard）：水平拆分，并行提速分片是将一个索引拆分为多个独立存储单元的机制。每个分片本质上是一个完整的 Lucene 索引，可以独立存储和检索数据，分布在集群的不同节点上。水平扩展存储容量单节点存储有上限。假设一个索引有 60GB 数据，设置 number_of_shards=5，则每个分片存储约 12GB，可分散到 5 个节点上。数据量增长时，通过增加节点即可承载更多分片。并行提升查询性能搜索请求到达后，协调节点将查询分发到所有相关分片并行执行，各分片返回局部结果后由协调节点合并排序。5 个分片意味着 5 路并行，查询延迟显著降低。分片数量在索引创建时确定，不可修改这是一个常考的面试点。主分片数一旦设定就无法更改（因为文档路由公式依赖分片数）。如果需要调整，只能通过 Reindex 重建索引。设置时需预估数据规模

Elasticsearch 集群架构中分片和副本的作用是什么？

分片（Shard）：水平拆分，并行提速

副本（Replica）：高可用与读扩展

分片与副本的协作机制

配置原则与最佳实践

面试常见追问