HDFS Hadoop分布式文件存储系统整体概述-Toy模板网

这篇具有很好参考价值的文章主要介绍了HDFS Hadoop分布式文件存储系统整体概述。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

HDFS

整体概述举例：

HDFS Hadoop分布式文件存储系统整体概述,hadoop,hadoop,分布式,hdfs

包括机架 rack1、rack2 包括5个Datanode,一个Namenode(主角色)带领5个Datanode(从角色)，每一个rack中包含不同的block模块文件为分块存储模式。块与块之间通过replication进行副本备份，进行冗余存储，Namenode对存储的元数据进行记录。该架构可以概括为一个抽象统一的目录树结构。

主从架构

HDFS集群是标准的master/slave主从架构群，一般一个HDFS集群有一个Namenode和一定数目的Datanode组成，Namenode是HDFS主节点（维护元数据），Datanode（管理数据块）是HDFS从节点，两种角色共同完成分布式文件的存储服务。
分块存储

HDFS中文件在物理上是分块存储的，每一块默认大小是128M，不足128M则自身为一块。

块的大小可以通过配置参数来规定，位于hdfs-default.xml中，dfs.blocksize。
副本机制

文件的每个block都会有副本，副本系数可以在文件创建的时候指定，也可以在之后通过命令改变，副本数量由参数dfs.replication控制，默认数为3，连同本身共三块副本。
元数据（解释型数据）管理

HDFS中元数据包括两种类型：

1）文件自身属性信息：文件名称、权限，修改时间、文件大小、复制因子、数据块大小。

2）文件块位置映射信息：记录文件块和Datenode之间的映射信息，即哪个块位于哪个节点上。
抽象目录树（namespace）

即传统的层次文件组织结构。用户可以创建目录，然后将文件保存在目录中，Namenode负责维护文件系统的namespace名称空间，任何对文件系统名称空间或属性的修改都将被Namenode记录下。
数据块存储

文件各个block的具体存储管理由DataNode节点承担，每一个block都可以在多个DataNode上存储。