Mongodb 简明教程

MongoDB - Sharding

分片是指在多台机器上存储数据记录的过程,并且是 MongoDB 满足数据增长需求的方法。随着数据大小的增加,单台机器可能不足以存储数据或提供可接受的读写吞吐量。分片通过横向扩展解决了该问题。使用分片,可以添加更多机器来支持数据增长以及读写操作的需求。

Why Sharding?

  1. 在复制中,所有写入都进入主节点

  2. 对延迟敏感的查询仍然会进入主节点

  3. 单个副本集有 12 个节点的限制

  4. 当活动数据集较大时,内存可能不够大

  5. 本地磁盘不够大

  6. 纵向扩展成本过高

Sharding in MongoDB

下图显示了使用分片集群在 MongoDB 中进行分片。

sharding

在下图中,有三个主要组件:

  1. Shards - 分片用于存储数据。它们提供高可用性和数据一致性。在生产环境中,每个分片都是一个单独的副本集。

  2. Config Servers - 配置服务器存储集群的元数据。此数据包含集群数据集到分片的映射。查询路由器使用此元数据将操作定向到特定分片。在生产环境中,分片集群恰好有 3 个配置服务器。

  3. Query Routers - 查询路由器基本上是 mongo 实例,与客户端应用程序和直接操作到相应分片进行接口。查询路由器处理操作并将其定向到分片,然后将结果返回给客户端。分片集群可以包含多个查询路由器以划分客户端请求负载。客户端向一个查询路由器发送请求。通常,分片集群有很多查询路由器。