Kibana 简明教程
Kibana - Aggregation And Metrics
在学习 Kibana 期间经常遇到的两个术语是存储段和指标聚合。本章将讨论它们在 Kibana 中所扮演的角色以及有关它们的更多详细信息。
What is Kibana Aggregation?
聚合指的是某个特定搜索查询或过滤器获得的文档集合或文档集。聚合构成在 Kibana 中构建所需的视化的主要概念。
每当执行任何可视化时,你需要确定标准,这意味着你要以什么方式对数据进行分组以对其执行度量。
在这一部分中,我们将讨论两种类型的聚合 −
-
Bucket Aggregation
-
Metric Aggregation
Bucket Aggregation
存储段主要包含一个键和一个文档。执行聚合时,会将文档放置在相应的存储段中。因此,最终你应该看到存储段列表,每个存储段都包含文档列表。在 Kibana 中创建可视化时你会看到的存储段聚合列表如下所示 −
存储段聚合具有以下列表 −
-
Date Histogram
-
Date Range
-
Filters
-
Histogram
-
IPv4 Range
-
Range
-
Significant Terms
-
Terms
在创建时,你需要为存储段聚合确定其中之一,即对存储段中的文档进行分组。
例如,对于分析,考虑我们在本教程开头上传的国家数据。countries 索引中可用的字段有国家名称、面积、人口、区域。在国家数据中,我们有国家名称及其人口、区域和面积。
让我们假设我们要按区域划分数据。然后,每个区域中的国家将成为我们的搜索查询,因此在这种情况下,区域将形成我们的存储段。下面的框图显示 R1、R2、R3、R4、R5 和 R6 是我们获得的存储段,而 c1、c2 …c25 是属于存储段 R1 至 R6 的文档列表。
我们可以看到每个存储段中有一些圆圈。它们是基于搜索标准的文档集,并被视为属于各个存储段的一部分。在存储段 R1 中,我们有文档 c1、c8 和 c15。这些文档是属于该区域的国家,对于其他的存储段而言也是如此。因此,如果我们计算存储段 R1 中的国家数量,则是 3,R2 为 6,R3 为 6,R4 为 2,R5 为 5,R6 为 4。
因此,通过存储段聚合,我们可以将文档聚合到存储段中,并像上面显示的那样获得该存储段中的文档列表。
到目前为止,我们所具有的存储段聚合列表有 −
-
Date Histogram
-
Date Range
-
Filters
-
Histogram
-
IPv4 Range
-
Range
-
Significant Terms
-
Terms
现在让我们详细讨论如何逐个形成这些存储段。
Date Histogram
日期直方图聚合用于日期字段。因此,如果你要用于可视化的索引在该索引中具有日期字段,则只能使用这种聚合类型。这是一个多存储段聚合,这意味着你有一些文档可以作为多个存储段的一部分。需要针对这种聚合使用一个间隔,具体信息如下 −
将“Bucket聚合”选择为“日期直方图”时,它将显示“字段”选项,其中仅提供与日期相关的字段。选择字段后,你需要选择具有以下详细信息的“时间间隔”−
因此,根据所选索引、字段和时间间隔中的文档,将对文档进行分类。例如,如果你选择每月时间间隔,则会将基于日期的文档转换为多个子段,根据月份(即 1 月至 12 月),文档将被放入子段中。在这里,1 月、2 月……12 月将是子段。
Filters
使用“过滤器”类型聚合,将根据过滤器形成子段。在这里,你会获得一个多子段,根据过滤器条件,一个文档可以存在一个或多个子段中。
使用过滤器,用户可以在过滤器选项中编写查询,如下所示 − 。
你可以通过使用“添加过滤器”按钮添加多个你选择的过滤器。
IPv4 Range
此类型的聚合被用于主要是用于 IP 地址。
我们拥有的索引,即 contriesdata-28.12.2018 没有类型为 IP 的字段,所以它会显示如上所示的消息。如果你碰巧有 IP 字段,你可以像上所示那样指定其中的“自”和“至”值。
Terms
此类型的聚合用于所有可用的字段,例如数字、字符串、日期、布尔值、IP 地址、时间戳等。请注意,这是我们将在本教程中处理的所有可视化中将要使用的聚合。
我们有一个“排序依据”选项,我们可以根据我们选择的指标对数据进行分组。大小是指你希望在可视化中显示的子段数。
接下来,我们来谈谈指标聚合。
Metric Aggregation
指标聚合主要指的是对子段中存在的文档进行的数学计算。例如,如果你选择一个数字字段,你可以针对此字段进行的指标计算包括计数、求和、最小值、最大值和平均值等。
这里给出了我们将讨论的指标聚合的列表 −
在本节中,让我们讨论我们将经常用到的重要指标 −
-
Average
-
Count
-
Max
-
Min
-
Sum
该指标将应用于我们已经在上面讨论过的各个子段聚合中。
接下来,我们在此讨论指标聚合列表 −