HDFS中的Federation联邦机制

这篇具有很好参考价值的文章主要介绍了HDFS中的Federation联邦机制。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

当前HDFS体系架构–简介

当前的HDFS结构有两个主要的层:

  • 命名空间(namespace)
    由文件,块和目录组成的统一抽象的目录树结构。由namenode根据用户操作实时维护树结构
  • 块存储层
    包括两部分:
    • 块管理:namenode执行块管理。块管理通过处理注册和定期心跳来提供DataNode集群成员身份。它处理块报告并迟滞与块相关的操作,如创建,删除,修改或获取块位置。它还维护块的位置,副本位置。为未复制的块管理块复制,并在已复制的块中删除
    • 存储:DataNode通过在本地文件系统上存储块并提供读/写访问权限来管理存储空间
      HDFS中的Federation联邦机制,# hdfs,hdfs,hadoop,大数据

局限性

当下的HDFS体系结构仅允许单个namenode委会文件系统名称空间。这货在那个体系目前存在着一些弊端性和局限性:

  • DataNode磁盘存储空间不够增加结点,namenode内存不够是否可以无线扩容。比如:一种是DataNode横向扩展机器增加结点,一种是纵向扩展单机加内存
  • 由于名称空间和存储层紧密耦合,namenode的替代实现很困难。这限制了其他服务直接使用块存储。namenode成了唯一入口
  • 文件系统的操作害限于namenode一次处理的任务数。因此,集群的性能取决于namenode吞吐量
  • 同样,由于使用的那个名称空间,因此使用集群的占用者组织之间没有隔离

联邦Federation架构

简介

  • Federation是namenode之间的Federation,也就是集群中会有多个namenode。多个那么node的情况意味着有多个namespace。注意,这区别于HA模式下的多namenode,HA中他们是拥有同一个namespace
  • Federation体系中多个那么node之间相互独立且不需要互相协调,各自分工,管理自己的区域。每个DataNode要向集群中所有的namenode注册,且周期性的向所有namenode发送心跳和块报告,并执行所有namenode的命令
    HDFS中的Federation联邦机制,# hdfs,hdfs,hadoop,大数据

好处

  • 命名空间可伸缩性
    • 使用Federation,可以水平扩展名称空间。这对大型集群或包含太多小文件的集群有利,因为想集群添加了更多的namenode。
  • 性能
    • 由于文件系统操作不熟单个那么node吞吐量的限制,因此可以提高文件系统的性能
  • 隔离
    -由于有多个名称空间,他可以为使用集群的占用者组织提供隔离

配置示例

HDFS中的Federation联邦机制,# hdfs,hdfs,hadoop,大数据文章来源地址https://www.toymoban.com/news/detail-627407.html

到了这里,关于HDFS中的Federation联邦机制的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • HDFS中的Trash垃圾桶回收机制

    回收站(垃圾桶)是windows操作系统里的一个系统文件夹,主要用来存放用户历史删除的文档文件资料,存放在回收站的文件可以恢复 回收站的功能给了我们一剂“后悔药”。回收站保存了删除的文件,文件夹,图片等。这些项目将一直保留在回收站中,直到清空回收站 HDF

    2024年02月13日
    浏览(28)
  • 【HDFS实战】HDFS联合(联邦)集群的发展史

    不管是之后的 NN与secondary namenode还是standby namenode其实实际运行的时候都是都可以抽象成以下的架构,因为active NN是唯一的。 HDFS拥有两个层 Namespace 由目录、文件和块组成。 它支持所有与命名空间相关的文件系统操作,例如创建、删除、修改和列出文件和目录。 Block Storage

    2024年02月11日
    浏览(22)
  • 大数据开发之Hadoop(HDFS)

    1、HDFS产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 2、HDFS定义 H

    2024年01月20日
    浏览(39)
  • 大数据技术之Hadoop(HDFS)

    1)HDFS产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是 分布式文件管理系统 。HDFS只是分布式文件管理系统中的一种。 2)HDFS定义

    2024年02月04日
    浏览(30)
  • HDFS 跨集群数据同步(hive,hadoop)

    两个不同的HDFS 集群数据迁移( A集群的数据 - B 集群) 采用的是 SHELL 脚本  按表进行; 日期分区进行; #!/bin/bash ##################### #创建人:DZH #创建日期: 2020-04 #内容: 数据迁移 ##################### ##################################### [ \\\"$#\\\" -ne 0 ] FILE=$1 path=$(cd `dirname $0`; pwd) ############## 获取执

    2024年04月27日
    浏览(32)
  • 大数据技术之Hadoop(HDFS)——超详细

    1.1 HDFS产出背景及定义 1)HDFS产生背景 先给大家介绍一下什么叫HDFS,我们生活在信息爆炸的时代,随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这

    2024年02月03日
    浏览(40)
  • 0201hdfs集群部署-hadoop-大数据学习

    下面我们配置下单namenode节点hadoop集群,使用vmware虚拟机环境搭建。vmware虚拟机的配置,在下面链接2有,或者自行查阅文档。hadoop安装包可到官网下载,当前相关软件环境如下: 软件 版本 说明 hadoop 3.3.4 jar包 vmware 15.5 虚拟机 centos 7.6 服务器操作系统 xshell 6 远程连接 jdk 1.8

    2024年02月11日
    浏览(28)
  • Hadoop理论及实践-HDFS读写数据流程(参考Hadoop官网)

    主节点和副本节点通常指的是Hadoop分布式文件系统(HDFS)中的NameNode和DataNode。 NameNode(主节点):NameNode是Hadoop集群中的一个核心组件,它负责管理文件系统的命名空间和元数据。它记录了文件的目录结构、文件的块分配信息以及每个文件块所在的DataNode等关键信息。NameNo

    2024年02月14日
    浏览(35)
  • hadoop之hdfs生产数据块损坏修复方法

    1、手动修复 检查数据块丢失情况 hdfs fsck / 修复指定路径的hdfs文件,尝试多次 hdfs debug recoverLease -path 文件位置 -retries 重复次数 删除所有损坏的块的数据文件 hdfs fsck / -delete 2、自动修复 hdfs会自动修复损坏的数据块,当数据块损坏后, DN节点执行directoryscan(datanode进行内村和

    2023年04月11日
    浏览(46)
  • Hadoop HDFS:海量数据的存储解决方案

    在大数据时代,数据的存储与处理成为了业界面临的一大挑战。Hadoop的分布式文件系统(Hadoop Distributed File System,简称HDFS)作为一个高可靠性、高扩展性的文件系统,提供了处理海量数据的有效解决方案。本文将深入探讨HDFS的设计原理、架构组成、核心功能以及实际应用场

    2024年04月23日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包