Apache Pig 简明教程

Apache Pig - Eval Functions

Apache Pig 提供了各种内置函数,即 eval, load, store, math, string, bagtuple 函数。

Eval Functions

以下是 Apache Pig 提供的 eval 函数列表。

S.N.

Function & Description

1

AVG() 计算包内数值的平均值。

2

BagToString() 将包中的元素连接成一个字符串。在连接时,我们可以在这些值之间放置一个分隔符(可选)。

3

CONCAT() 连接相同类型的两个或多个表达式。

4

COUNT() 获得包中元素的数量,同时计算包中元组的数量。

5

COUNT_STAR() 它类似于 COUNT() 函数。它用于获得包中元素的数量。

6

DIFF() 比较元组中的两个包(字段)。

7

IsEmpty() 检查包或映射是否为空。

8

MAX() 计算单列包中一列(数值或 chararray)的最高值。

9

MIN() 获得单列包中某一列的最小(最低)值(数值或字符数组)。

10

PluckTuple() 使用 Pig Latin PluckTuple() 函数,我们可以定义一个字符串前缀并筛选一个关系中以给定前缀开头的列。

11

SIZE() 根据任何 Pig 数据类型计算元素数量。

12

SUBTRACT() 减去两个包。它把两个包作为输入,并返回一个包,其中包含不在第二个包中的第一个包的元组。

13

SUM() 获得单列包中某一列的数值总和。

14

TOKENIZE() 将字符串(包含一组单词)分割成单独的元组中,并返回一个包含分割操作输出的包。