Hadoop 简明教程
Hadoop - HDFS Overview
Hadoop 文件系统是使用分布式文件系统设计开发的。它在商品硬件上运行。与其他分布式系统不同,HDFS 的容错性很高,并且设计为使用低成本硬件。
HDFS 拥有非常大量的数据,并且提供了更轻松的访问方式。为了存储如此庞大的数据,这些文件被存储在多台机器上。这些文件以冗余的方式存储,以在发生故障时防止系统出现可能的数据丢失。HDFS 还会使应用程序可用于并行处理。
Features of HDFS
-
它适用于分布式存储和处理。
-
Hadoop 提供了一个命令界面来与 HDFS 进行交互。
-
名称节点和数据节点的内置服务器帮助用户轻松检查集群状态。
-
流式访问文件系统数据。
-
HDFS 提供文件权限和身份验证。
HDFS Architecture
下面给出了 Hadoop 文件系统的体系结构。
HDFS 遵循主从架构,它具有以下元素。
Namenode
名称节点是包含 GNU/Linux 操作系统和名称节点软件的商品硬件。它是一种可以在商品硬件上运行的软件。拥有名称节点的系统充当主服务器,并执行以下任务:
-
管理文件系统命名空间。
-
规范客户端对文件的访问。
-
同样,它执行文件系统操作,诸如重命名、关闭以及打开文件和目录。