HDFS中的Federation联邦机制

7月前作者：fiveym 分类：Toy博客阅读(27) 违法举报

这篇具有很好参考价值的文章主要介绍了HDFS中的Federation联邦机制。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

当前HDFS体系架构–简介

当前的HDFS结构有两个主要的层：

命名空间（namespace）
由文件，块和目录组成的统一抽象的目录树结构。由namenode根据用户操作实时维护树结构
块存储层
包括两部分：
- 块管理：namenode执行块管理。块管理通过处理注册和定期心跳来提供DataNode集群成员身份。它处理块报告并迟滞与块相关的操作，如创建，删除，修改或获取块位置。它还维护块的位置，副本位置。为未复制的块管理块复制，并在已复制的块中删除
- 存储：DataNode通过在本地文件系统上存储块并提供读/写访问权限来管理存储空间

局限性

当下的HDFS体系结构仅允许单个namenode委会文件系统名称空间。这货在那个体系目前存在着一些弊端性和局限性：

DataNode磁盘存储空间不够增加结点，namenode内存不够是否可以无线扩容。比如：一种是DataNode横向扩展机器增加结点，一种是纵向扩展单机加内存
由于名称空间和存储层紧密耦合，namenode的替代实现很困难。这限制了其他服务直接使用块存储。namenode成了唯一入口
文件系统的操作害限于namenode一次处理的任务数。因此，集群的性能取决于namenode吞吐量
同样，由于使用的那个名称空间，因此使用集群的占用者组织之间没有隔离

联邦Federation架构

简介

Federation是namenode之间的Federation，也就是集群中会有多个namenode。多个那么node的情况意味着有多个namespace。注意，这区别于HA模式下的多namenode，HA中他们是拥有同一个namespace
Federation体系中多个那么node之间相互独立且不需要互相协调，各自分工，管理自己的区域。每个DataNode要向集群中所有的namenode注册，且周期性的向所有namenode发送心跳和块报告，并执行所有namenode的命令

好处

命名空间可伸缩性
- 使用Federation，可以水平扩展名称空间。这对大型集群或包含太多小文件的集群有利，因为想集群添加了更多的namenode。
性能
- 由于文件系统操作不熟单个那么node吞吐量的限制，因此可以提高文件系统的性能
隔离
-由于有多个名称空间，他可以为使用集群的占用者组织提供隔离

配置示例

HDFS中的Federation联邦机制,# hdfs,hdfs,hadoop,大数据文章来源地址https://www.toymoban.com/news/detail-627407.html

到了这里，关于HDFS中的Federation联邦机制的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

HDFS中的Trash垃圾桶回收机制

回收站（垃圾桶）是windows操作系统里的一个系统文件夹，主要用来存放用户历史删除的文档文件资料，存放在回收站的文件可以恢复回收站的功能给了我们一剂“后悔药”。回收站保存了删除的文件，文件夹，图片等。这些项目将一直保留在回收站中，直到清空回收站 HDF

2024年02月13日
浏览(28)
【HDFS实战】HDFS联合（联邦）集群的发展史

不管是之后的 NN与secondary namenode还是standby namenode其实实际运行的时候都是都可以抽象成以下的架构，因为active NN是唯一的。 HDFS拥有两个层 Namespace 由目录、文件和块组成。它支持所有与命名空间相关的文件系统操作，例如创建、删除、修改和列出文件和目录。 Block Storage

2024年02月11日
浏览(22)
大数据开发之Hadoop（HDFS）

1、HDFS产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 2、HDFS定义 H

2024年01月20日
浏览(39)
大数据技术之Hadoop（HDFS）

1）HDFS产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 2）HDFS定义

2024年02月04日
浏览(30)
HDFS 跨集群数据同步（hive,hadoop）

两个不同的HDFS 集群数据迁移( A集群的数据 - B 集群) 采用的是 SHELL 脚本按表进行; 日期分区进行; #!/bin/bash ##################### #创建人:DZH #创建日期: 2020-04 #内容：数据迁移 ##################### ##################################### [ \\\"$#\\\" -ne 0 ] FILE=$1 path=$(cd `dirname $0`; pwd) ############## 获取执

2024年04月27日
浏览(32)
大数据技术之Hadoop（HDFS）——超详细

1.1 HDFS产出背景及定义 1）HDFS产生背景先给大家介绍一下什么叫HDFS，我们生活在信息爆炸的时代，随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这

2024年02月03日
浏览(40)
0201hdfs集群部署-hadoop-大数据学习

下面我们配置下单namenode节点hadoop集群，使用vmware虚拟机环境搭建。vmware虚拟机的配置，在下面链接2有，或者自行查阅文档。hadoop安装包可到官网下载，当前相关软件环境如下：软件版本说明 hadoop 3.3.4 jar包 vmware 15.5 虚拟机 centos 7.6 服务器操作系统 xshell 6 远程连接 jdk 1.8

2024年02月11日
浏览(28)
Hadoop理论及实践-HDFS读写数据流程（参考Hadoop官网）

主节点和副本节点通常指的是Hadoop分布式文件系统（HDFS）中的NameNode和DataNode。 NameNode（主节点）：NameNode是Hadoop集群中的一个核心组件，它负责管理文件系统的命名空间和元数据。它记录了文件的目录结构、文件的块分配信息以及每个文件块所在的DataNode等关键信息。NameNo

2024年02月14日
浏览(35)
hadoop之hdfs生产数据块损坏修复方法

1、手动修复检查数据块丢失情况 hdfs fsck / 修复指定路径的hdfs文件，尝试多次 hdfs debug recoverLease -path 文件位置 -retries 重复次数删除所有损坏的块的数据文件 hdfs fsck / -delete 2、自动修复 hdfs会自动修复损坏的数据块，当数据块损坏后， DN节点执行directoryscan(datanode进行内村和

2023年04月11日
浏览(46)
Hadoop HDFS：海量数据的存储解决方案

在大数据时代，数据的存储与处理成为了业界面临的一大挑战。Hadoop的分布式文件系统（Hadoop Distributed File System，简称HDFS）作为一个高可靠性、高扩展性的文件系统，提供了处理海量数据的有效解决方案。本文将深入探讨HDFS的设计原理、架构组成、核心功能以及实际应用场

2024年04月23日
浏览(29)