Apache Pig 简明教程

Apache Pig Tutorial

Apache Pig 是 MapReduce 的抽象。它是一个工具/平台,用于分析表示为数据流的大量数据集。Pig 通常与 Hadoop 一起使用;我们可以使用 Pig 在 Hadoop 中执行所有数据操作。

Audience

本教程面向所有正在 Hadoop 上工作的专业人员,希望在不必编写复杂的 Java 代码的情况下执行 MapReduce 操作。

Prerequisites

要充分利用本教程,你应该对 Hadoop 和 HDFS 命令的基本原理有深入的了解。如果你熟练掌握 SQL,肯定会有帮助。