Hcatalog 简明教程

HCatalog Tutorial

HCatalog 是 Hadoop 的表存储管理工具,它将 Hive Metastore 的表格数据公开给其他 Hadoop 应用程序。它使用不同的数据处理工具(Pig、MapReduce)的用户可以轻松地将数据写在表单中。HCatalog 确保用户不必担心数据存储的位置或格式。这是一个简短的教程,解释了 HCatalog 的一些基本知识以及如何使用它。

Audience

本教程针对有志于使用 Hadoop Framework 从事大数据分析职业的专业人士。ETL 开发人员和从事一般分析的专业人员也可以很好地利用本教程。

Prerequisites

在继续学习本教程之前,您需要掌握 Core Java 的基本知识、SQL 数据库概念、Hadoop 文件系统,以及 Linux 操作系统的任何版本。