Sqoop 简明教程
Sqoop - Introduction
传统应用程序管理系统,也就是应用程序使用 RDBMS 与关系数据库交互,是大数据生成的源头之一。此类由 RDBMS 生成的海量数据被储存在关系 Database Servers 中,即关系数据库结构中。
当 Hadoop 生态系统的大数据存储和分析器(例如 MapReduce、Hive、HBase、Cassandra、Pig 等)进入人们的视野后,它们需要一个工具与关系数据库服务器交互,以导入和导出其中驻留的大数据。在此,Sqoop 占据了 Hadoop 生态系统中的一个位置,以在关系数据库服务器和 Hadoop 的 HDFS 之间提供可行的交互。
Sqoop −“SQL 到 Hadoop,Hadoop 到 SQL”
Sqoop 是一款设计用于在 Hadoop 与关系数据库服务器之间传输数据的工具。它用于将数据从诸如 MySQL 和 Oracle 等关系数据库导入 Hadoop HDFS,以及将数据从 Hadoop 文件系统导出到关系数据库。它由 Apache 软件基金会提供。