hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等

这篇具有很好参考价值的文章主要介绍了hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

hbase2.x RIT(region in transition)背景知识

在hbase1.x中transition是令广大大数据运维人员头疼的一个话题,因为,region 的状态转移涉及到了三个核心组件,分别为:hbase master,zookeeper和hbase 的regionserver,这三个组件中的某一个region的状态都是一致的情况下,这个region 才算是正常,状态转移过程及其复杂,hbase 集群很容易出现RIT。

好消息是,hbase2.x中,把zookeeper 中的状态取消了,region 的状态直接在master 和 regionserver 直接变化。

在hbase2.x 中几乎所有的集群操作都是通过procedure进行的,这也就意味着,产生异常的过程大部分都是在proceduer中,比如region opening 过程卡死或者closing 过程卡死,最终都会导致region 的状态有问题,即产生region in transition。

好消息是,hbase2.x中有个工具HBCK2,这个工具可不是简单的hbase1.x中hbck 的升级,变化有点大,详细变化请参考帮助文档(https://github.com/apache/hbase-operator-tools/tree/master/hbase-hbck2)。这个工具的工作实际就是修复各种不正常的procedure。(本文已提供工具免费下载)

一.RIT region长期处于OPEING 

如果RIT中的region长期处于opening状态,按以下步骤排查:

1.查看该region对应的regionserver日志,搜索该region名字,看有没有报错

1)如果有报错,提示有坏的hfile文件(如下图),hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

则把hfile文件mv走,mv hfile之后一般情况下该region会自动好,如果还是处于RIT,就先bypass掉相关procedure,然后再unassign,再assign一下

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

2)如果有报错The new max sequence id 1 is less than the max sequence id

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

方法1:disable 表,再enable 表

方法2:

对于从hbase1迁移到hbase2的表,如果表的DATA_BLOCK_ENCODING是PREFIX_TREE,由于PREFIX_TREE在hbase2里已废弃,所以需要修改

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

2.如果该region对应的regionserver日志中没有明显错误,就先bypass掉相关procedure,然后再把region设置为OFFLINE,再assign一下

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

如果还是不行,就先bypass掉相关procedure,然后再把region状态设为OFFLINE,再unassign,再assign

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

二.RIT region长期处于CLOSING

1.先bypass相关procedure,再把region状态设置为CLOSED,然后再assign

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

hbase hbck -j hbase-hbck2-1.0.0.0-SNAPSHOT.jar setRegionState region名字 CLOSED

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

三.RIT region长期处于OFFLINE

把region assign

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

四.某个hbase表已经删除,但是还有这个表相关的region处于RIT

处理步骤:

1.bypass 该region相关的procedure

2.从meta表查看该region的信息

3.deleteall从meta表删除该region

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

4.切换hmaster

hbase UI上的RIT应该是从meta表里拿的状态为OPENING、OFFLINE等中间状态的region。从meta表里删了的,切了hmaster之后就没有了;状态改为CLOSED的region, CLOSED不是中间状态,是最终状态了,所以也就没有了。

五.hbase2 HBCK Report Region Holes

Hbck report中显示有holes。Region Holes(Region空洞:Region不连续)

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

查看该问题可通过master UI界面的HBCK Report查看

解决方法很简单,直接使用 hbck2 提供的 fixMeta 操作即可。

在 Usage 说明中能看到 fixMeta 能够修复 ‘holes’,‘overlaps’ 等 region 问题,但是需要注意必须确保 hbase:meta 是健康的状态下进行修复操作!也就是确保表里的所有 region 都是 OPEN 状态再进行此操作,确保不会对集群造成额外的影响。

执行命令

hbase hbck -j $HBASE_HOME/lib/hbase-hbck2-1.3.0-SNAPSHOT.jar fixMeta

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

等待一段时间,这个过程可以监控 master 日志,如果一切顺利问题就解决啦。

六.Hbck report Unkown server处理

base 查询出现org.apache.hadoop.hbase.NotServingRegionException:

table.region is not online on hregionservername

重启hmaster,出现region无法自动分配,assign region也无法重新分配。

查看hbck report 发现有unknown servers的问题。

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

原因:regionserver的name发生变化。
删除掉当前未知的regionsever,恢复正常

hbase hbck -j hbase-hbck2-1.3.0-SNAPSHOT.jar scheduleRecoveries unknowservername

 hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

批量脚本

如果有多个region需要处理可以使用批量脚本

1.批量bypass

从页面http://hmaster主机:16010/procedures.jsp拿到procedure id列表

然后批量bypass

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

2.批量unassign

从页面http://hmaster主机:16010/master.jsp拿到region列表

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

3.批量assign

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据

4.批量set offline

hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等,hbase,大数据文章来源地址https://www.toymoban.com/news/detail-770167.html

到了这里,关于hbase2.x hbck2处理region方案(长期opening\closing\offline,Report Region Holes,report Unkown server)等的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hbase2 基于hdfs恢复数据及迁移

    故障描述 某客户因为数据表数量过多,导致HBase Master无法初始化完成。根据日志判断为Meta错误。 故障分析 客户频繁操作HBase Master导致混乱,加载失败。 处理过程        1.判断客户hdfs数据正常,基于Hbase2特性,可以基于hdfs进行数据恢复        2.停用hbase服务;        

    2024年02月16日
    浏览(69)
  • Hadoop(05) HBase2.5.5安装和编程实践指南

    HBase是一个基于Apache Hadoop的 分布式、可扩展、面向列的NoSQL数据库系统 。它被设计用于处理大规模数据集,并提供快速的读写访问性能。 以下是HBase的一些关键特点和概念: 列存储结构:HBase使用列存储结构,意味着数据被组织成行和列的形式。每个表可以有灵活的列族定义

    2024年02月03日
    浏览(46)
  • Hbase split Region

    Split(Region拆分) ​ 自动拆分 根据region大小触发拆分 ​ 早期(0.94版本前)HBase仅根据Region中最大的列簇大小(即一个Store,也即HFile)进行自动拆分,默认拆分阈值为10G,当大小达到10G后,将这个region拆分为两个region。参数为: 根据文件大小动态触发拆分 ​ 0.94版本之后,有

    2024年02月16日
    浏览(35)
  • Hbase中的region和rowkey

    Region是HBase数据管理的基本单位,region有一点像关系型数据的分区。 Region中存储这用户的真实数据,而为了管理这些数据,HBase使用了RegionSever来管理region。 一个表中可以包含一个或多个Region。 每个Region只能被一个RS(RegionServer)提供服务,RS可以同时服务多个Region,来自不同

    2024年02月08日
    浏览(34)
  • 【生产级实践】Docker部署配置Hadoop3.x + HBase2.x实现真正分布式集群环境

    网上找了很多资料,但能够实现Docker安装Hadoop3.X和Hbase2.X真正分布式集群的教程很零散,坑很多, 把经验做了整理, 避免趟坑。 1、机器环境 这里采用三台机器来部署分布式集群环境: 192.168.1.101 hadoop1 (docker管理节点) 192.168.1.102 hadoop2 192.168.1.103 hadoop3 2、下载Docker Hadoop的

    2024年02月02日
    浏览(48)
  • HBase基础知识(三):HBase架构进阶、读写流程、MemStoreFlush、StoreFile Compaction、Region Split

    1)StoreFile 保存实际数据的物理文件,StoreFile以HFile的形式存储在HDFS上。每个Store会有一个或多个StoreFile(HFile),数据在每个StoreFile中都是有序的。 2)MemStore 写缓存,由于HFile中的数据要求是有序的,所以数据是先存储在MemStore中,排好序后,等到达刷写时机才会刷写到HFi

    2024年01月17日
    浏览(49)
  • Springboot+Hbase获取regions信息并上报到metrics接口中

    1. 添加HBase和Micrometer依赖 2. 新增HBase配置文件 3. 编写服务获取HBase Admin客户端 4. 获取regions信息并上报 5. 启动定时任务

    2024年02月13日
    浏览(59)
  • 【计算机视觉 | 目标检测】CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor

    基于区域提示和锚点预匹配的开放词汇检测。 CORA 在目标检测任务中提出了一种新的 CLIP 预训练模型适配方法,主要包括 Region Prompting 和 Anchor Pre-Matching 两部分。 这种方法能够让 CLIP 模型适应目标检测的任务,能够识别出图像中的对象,并提供准确的分类和定位信息。 开放

    2024年02月14日
    浏览(43)
  • 小程序一次性订阅消息进行长期推送方案

    由于小程序长期只针对向政务民生、医疗、交通、金融、教育等线下公共服务开放,且目前的项目不符合这些主类目要求,所以只能从一次性模板进行下手。 一次性模板指的是用户授权一次,可以推送一次消息,所以一次性模板想要长期推送我用的方案是在点击的地方都增加

    2024年02月12日
    浏览(39)
  • 天池长期赛:二手车价格预测(422方案分享)

    前言 一、赛题介绍及评测标准 二、数据探索(EDA) 1.读取数据、缺失值可视化 2.特征描述性统计 3.测试集与验证集数据分布 4.特征相关性 三、数据清洗 四、特征工程 1.构建时间特征 2.匿名特征交叉 3.平均数编码 五、建模调参 六、模型融合 总结 赛题属于回归类型,相比于

    2024年02月01日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包