HDFS集群滚动升级以及回滚相关

1年前作者：fiveym分类：Toy博客阅读(24)违法举报

这篇具有很好参考价值的文章主要介绍了HDFS集群滚动升级以及回滚相关。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

介绍

在hadoop v2中，HDFS支持namenode高可用（HA），使得不停机升级HDFS变的可行。注：从hadoop2.4.0开始才支持滚动升级
因此为了在不停机的情况下升级hdfs集群，必须使用HA设置集群
在HA集群中，有两个或多个namenode，许多DataNode，一下journalnode和一下zookeepernode
JN相对稳定，在大多数情况下，升级HDFS时不需要升级
滚动升级过程中，仅针对NNS和DNS，JNS和ZKNS都没有，升级JN和ZKN可能会导致集群停机

不停机滚动升级

非联邦HA集群

假设有两个名称结点NN1和NN2，其中NN1和NN2分别处于active和standby状态

HDFS集群滚动升级以及回滚相关,# hdfs,hdfs,hadoop,大数据

HDFS集群滚动升级以及回滚相关,# hdfs,hdfs,hadoop,大数据

HDFS集群滚动升级以及回滚相关,# hdfs,hdfs,hadoop,大数据

HDFS集群滚动升级以及回滚相关,# hdfs,hdfs,hadoop,大数据

联邦HA集群

联邦集群是拥有多namespace的集群。每个namespace对应一对主备namenode节点
上述这套集群就是速成的联邦+HA集群
联邦集群的升级过程与非联邦集群的升级过程比较相似，没有什么本质不同，知识需要为不同的namespace多重复执行几遍升级操作而已

停机升级–非HA集群

在升级的过程中，势必会存在服务短暂停止的时间，因为namenode需要重启，而这段时间并没有备用节点可选
整体过程同非联邦HA模式的4个步骤类似。不过步骤2的过程要修改

HDFS集群降级和回滚

异同点

共同点

都会将版本退回到升级前的版本
在升级的funalize动作执行之后，将不允许再执行降级和回滚

不同点

降级能支持rolling的方式，可以滚动降级，而回滚需要停止服务一段时间
降级过程只会将软件版本还原成升级前的，会保留用户现有的数据状态
而回滚则会将用户数据还原成升级前的状态模式，现有的数据状态不保存
升级慎重，降级、回滚更要慎重
生产环境中，集群升级之前必须进行调研，评估升级后的版本跟现有业务的兼容性
在测试环境下完整模拟升级流程，并且针对升级前集群状态进行备份，避免以外发生导致集群中断
不要奢求升级失败时，通过回滚、降级等操作挽救集群

HA集群降级（downgrade）

HDFS集群滚动升级以及回滚相关,# hdfs,hdfs,hadoop,大数据

文章来源地址https://www.toymoban.com/news/detail-630540.html

注意事项

降级与升级在HA模式有一个共同点
在操作namenode时，都是standby节点开始操作，等standby节点升/降结束，做一次切换，使另一个节点得以进行升/降操作，在全程中，始终保持一个active节点对外提供服务
降级过程namenode与DataNode的操作和在升级时操作完全相反
新版本一般在协议，api只兼容老版本的，如果先降级NN，那么则会造成DN是新本，NN是旧版
新版DN中的许多协议将会在旧版NN中可能不在兼容
所以这里必须要先降级DN，然后再把服务端NN进行降级
联邦集群和非HA集群的降级操作与升级操作想对应，进行相应操作命令替换即可

集群回滚操作

回滚注意事项
- rollback不支持滚动操作的方式，在操作期间，他需要集群对外停止服务
- rollback操作不仅会将软件版本退回到升级前的版本，还会将用户数据退回到升级前的状态
回滚步骤

到了这里，关于HDFS集群滚动升级以及回滚相关的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

HDFS 跨集群数据同步（hive,hadoop）
两个不同的HDFS 集群数据迁移( A集群的数据 - B 集群) 采用的是 SHELL 脚本按表进行; 日期分区进行; #!/bin/bash ##################### #创建人:DZH #创建日期: 2020-04 #内容：数据迁移 ##################### ##################################### [ \\\"$#\\\" -ne 0 ] FILE=$1 path=$(cd `dirname $0`; pwd) ############## 获取执
2024年04月27日
浏览(48)
Hadoop集群启动后利用Web界面管理HDFS
Hadoop集群启动后，可以通过自带的浏览器Web界面查看HDFS集群的状态信息，访问IP为NameNode所在服务器的IP地址， hadoop版本为3.0以前访问端口默认为9870 ， hadoop版本为3.0以后访问端口默认为50070 。（下面测试版本为Hadoop3.0以后的）一、利用ifconfig命令查看NameNode所在服
2024年02月11日
浏览(10)
大数据技术之Hadoop：HDFS集群安装篇（三）
目录分布式文件系统HDFS安装篇一、为什么海量数据需要分布式存储二、分布式的基础架构分析三、 HDFS的基础架构四 HDFS集群环境部署 4.1 下载安装包 4.2 集群规划 4.3 上传解压 4.4 配置HDFS集群 4.5 准备数据目录 4.6 分发hadoop到其他服务器 4.7 配置环境变量 4.8 为普通用户授
2024年02月14日
浏览(11)
Hadoop系统应用之HDFS相关操作 - - Java-API对HDFS的操作（IDEA版）
通过Java API来操作HDFS文件系统HDFS，相关的操作有：文件上传、文件下载、新建文件夹、查看文件、删除文件。 1.Linux下安装好hadoop，这里使用hadoop2.7.3 2.window解压hadoop2.7.3的包 2.Windows下安装好jdk1.8 3.Windows下安装好IDEA，这里使用IDEA2022 4.Windows下安装好maven，这里使用Maven3.6.3
2024年02月05日
浏览(16)
Java 操作 Hadoop 集群之 HDFS 的应用案例详解
注意：本文内容基于 Hadoop 集群搭建完成基础上： Linux 系统 CentOS7 上搭建 Hadoop HDFS集群详细步骤本文的内容是基于下面前提： Hadoop 集群搭建完成并能正常启动和访问 Idea 和 Maven 分别安装完成需要有 JavaSE 基础和熟悉操作hadoop 的 hdfs dfs 命令 Maven 及 idea 中 Maven 相关配置本地
2024年04月16日
浏览(23)
部署HDFS集群（完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包）
目录前置一、上传解压（一）上传（二）解压二、修改配置文件（一）配置workers文件（二）配置hadoop-env.sh文件（三）配置core-site.xml文件（四）配置hdfs-site.xml文件三、分发到hp2、hp3, 并设置环境变量（一）准备数据目录（二）配置环境变量四、创建数据目录，并
2024年04月14日
浏览(17)
【运维】hadoop 集群安装（三）hdfs、yarn集群配置、nodemanager健康管理讲解
上篇简单说明了多节点的hadoop节点怎么安装，但是没有细致的分析hadoop相关配置，具体怎么根据环境进行配置，接下来我们对这些配置进行讲解 Daemon Environment Variable NameNode HDFS_NAMENODE_OPTS DataNode HDFS_DATANODE_OPTS Secondary NameNode HDFS_SECONDARYNAMENODE_OPTS ResourceManager YARN_RESOURCEMANAGER_OP
2024年02月10日
浏览(7)
Hadoop入门学习笔记——二、在虚拟机里部署HDFS集群
视频课程地址：https://www.bilibili.com/video/BV1WY4y197g7 课程资料链接：https://pan.baidu.com/s/15KpnWeKpvExpKmOC8xjmtQ?pwd=5ay8 Hadoop入门学习笔记（汇总）下载Hadoop：https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz 本次演示部署结构如下图所示：本次部署服务清单如下表所示
2024年02月01日
浏览(13)
（十二）大数据实战——hadoop集群之HDFS高可用自动故障转移
本节内容主要介绍一下hadoop集群下实现HDFS高可用的自动故障转移，HDFS高可用的自动故障转移主要通过zookeeper实现故障的监控和主节点的切换。自动故障转移为 HDFS 部署增加了两个新组件：ZooKeeper 和 ZKFailoverController （ZKFC）进程。ZooKeeper 是维护少量协调数据，通知客户端这些
2024年02月13日
浏览(16)
【大数据之Hadoop】二十八、生产调优-HDFS集群扩容及缩容
增加或缩减服务器，注意不允许白名单和黑名单同时出现同一个主机。原有数据节点不能满足数据存储需求时，需要在原有集群的基础上动态增加节点，即动态增加服务器，增加服务器的同时不需要重启集群。 hadoop完全分布式集群设置了3个datanode节点，当白名
2024年02月03日
浏览(12)