Apache Solr 简明教程

Apache Solr - Terminology

在本章中,我们将尝试理解在使用 Solr 时经常使用的一些术语的真实含义。

General Terminology

以下是所有类型的 Solr 设置中都会用到的常规术语列表:

  1. Instance − 就像 tomcat instancejetty instance 一样,此术语是指运行在 JVM 内的应用程序服务器。Solr 的主页目录提供对每个 Solr 实例的引用,可以在每个实例中配置一个或多个内核以在其中运行。

  2. Core − 在应用程序中运行多个索引时,您可以在每个实例中使用多个内核,而不是每个内核多个实例。

  3. Home − 术语 $SOLR_HOME 指主页目录,其中包含有关内核及其索引、配置和依赖项的所有信息。

  4. Shard − 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中每块数据都可以称为 Shard 。它包含整个索引的子集。

SolrCloud Terminology

之前在章节中,我们讨论过如何以独立模式安装 Apache Solr。请注意,我们也可以在分布式模式(云环境)中安装 Solr,在该模式下以主从模式安装 Solr。在分布式模式中,索引在主服务器上创建,并复制到一个或多个从服务器。

Solr Cloud 相关的关键词如下:

  1. Node − 在 Solr 云中,每个独立的 Solr 实例都被视为一个 node

  2. Cluster − 环境的所有节点组合在一起形成一个 cluster

  3. Collection − 集群有一个逻辑索引,称为 collection

  4. Shard − 分片是索引的一个或多个副本的集合的一部分。

  5. Replica − 在 Solr Core 中,在节点中运行的分片副本称为 replica

  6. Leader − 它也是分片的副本,它将 Solr Cloud 的请求分发到其余副本。

  7. Zookeeper − 这是 Solr Cloud 用于集中配置和协调的 Apache 项目,用于管理集群并选举领导者。

Configuration Files

Apache Solr 中的主要配置文件如下:

  1. Solr.xml − 这是 $SOLR_HOME 目录中的文件,其中包含 Solr Cloud 相关信息。为了加载核心,Solr 引用此文件,这有助于识别核心。

  2. Solrconfig.xml − 此文件包含与请求处理和响应格式化相关的定义和特定于核心的配置,以及索引、配置、管理内存和提交。

  3. Schema.xml − 此文件包含整个架构以及字段和字段类型。

  4. Core.properties − 此文件包含特定于核心的配置。它用于 core discovery ,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,然后将被视为 core directory