大数据面试题：HBase读写数据流程

9月前作者：蓦然_ 分类：Toy博客阅读(42) 违法举报

这篇具有很好参考价值的文章主要介绍了大数据面试题：HBase读写数据流程。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

面试题来源：

《大数据面试题 V4.0》

大数据面试题V3.0，523道题，679页，46w字

参考答案：

1、写数据流程

大数据面试题：HBase读写数据流程,大数据面试题,大数据,hbase,面试

1）Client先访问zookeeper，获取hbase:meta表位于哪个Region Server。

2）访问对应的Region Server，获取hbase:meta表，根据读请求的namespace:table/rowkey，查询出目标数据位于哪个Region Server中的哪个Region中。并将该table的region信息以及meta表的位置信息缓存在客户端的meta cache，方便下次访问。

3）与目标Region Server进行通讯；

4）将数据顺序写入（追加）到WAL；

5）将数据写入对应的MemStore，数据会在MemStore进行排序；

6）向客户端发送ack；

7）等达到MemStore的刷写时机后，将数据刷写到HFile。

2、读数据流程

大数据面试题：HBase读写数据流程,大数据面试题,大数据,hbase,面试

大数据面试题：HBase读写数据流程,大数据面试题,大数据,hbase,面试

1）Client先访问zookeeper，获取hbase:meta表位于哪个Region Server。

2）访问对应的Region Server，获取hbase:meta表，根据读请求的namespace:table/rowkey，查询出目标数据位于哪个Region Server中的哪个Region中。并将该table的region信息以及meta表的位置信息缓存在客户端的meta cache，方便下次访问。

3）与目标Region Server进行通讯；

4）分别在Block Cache（读缓存），MemStore和Store File（HFile）中查询目标数据，并将查到的所有数据进行合并。此处所有数据是指同一条数据的不同版本（time stamp）或者不同的类型（Put/Delete）。

5）将查询到的数据块（Block，HFile数据存储单元，默认大小为64KB）缓存到Block Cache。

6）将合并后的最终结果返回给客户端。文章来源地址https://www.toymoban.com/news/detail-608524.html

到了这里，关于大数据面试题：HBase读写数据流程的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

客户端读写HBase数据库的运行原理

1.HBase的特点 HBase是一个数据库，与RDMS相比，有以下特点： ① 它不支持SQL ② 不支持事务 ③ 没有表关系，不支持JOIN ④ 有列族，列族下可以有上百个列 ⑤ 单元格，即列值，可以存储多个版本的值，每个版本都有对应时间戳 ⑥ 行键按照字典序升序排列 ⑦ 元数据和数据分

2024年02月10日
浏览(57)
大数据面试题Hbase篇

目录 1.Hbase是什么？ 2.HBase 的特点是什么？ 3.HBase 和 Hive 的区别？ 4.描述 HBase 的 rowKey 的设计原则？ 5.请详细描述 HBase 中一个 cell 的结构？ 6.hbase中分布式存储的最小单元？ 7.简述 HBase 中 compact 用途是什么，什么时候触发，分为哪两种，有什么区别，有哪些相关配置参数？

2024年02月09日
浏览(45)
记录「 Hbase的数据迁移与bulkload流程与实践」

目录项目场景：数据迁移方案 hbase和hadoop相关命令方案介绍 DistCp分布式拷贝方案实施迁移过程中遇到的一些问题 1.我在原集群先拷贝协处理器到目标新节点过程中出现了如下的情况，hdfs的map任务一直处于卡住状态，通过页面前两行看到hadoop集群没有资源，有3个节点处于

2024年02月04日
浏览(37)
大数据面试题：HBase为什么查询快

面试题来源：《大数据面试题 V4.0》大数据面试题V3.0，523道题，679页，46w字可回答：1）HBase为什么读快；2）HBase是根据rowkey查询，当数据量相当大的时候，是怎么读的很快的参考答案： 1、基于LSM树的存储方式 HBase采用基于LSM树的存储方式，这种存储方式将数据分为内存和

2024年02月12日
浏览(46)
大数据面试题：HBase的RegionServer宕机以后怎么恢复的？

面试题来源：《大数据面试题 V4.0》大数据面试题V3.0，523道题，679页，46w字可回答：1）HBase一个节点宕机了怎么办；2）HBase故障恢复参考答案： 1、HBase常见故障导致RegionServer故障的原因： FullGc引起长时间停顿 HBase对Jvm堆内存管理不善，未合理使用堆外内存 Jvm启动参数配

2024年02月14日
浏览(37)
Hbase基本使用，读写原理，性能优化学习

HBase简介 HBase定义 Apache HBase 是以 hdfs 为数据存储的，一种分布式、可扩展的 NoSQL 数据库 HBase数据模型 HBase 的设计理念依据 Google 的 BigTable 论文，论文中对于数据模型的首句介绍。 Bigtable 是一个稀疏的、分布式的、持久的多维排序 map。之后对于映射的解释如下：该映射由行

2024年02月08日
浏览(46)
HBase-写流程

写流程顺序正如API编写顺序，首先创建HBase的重量级连接（1）读取本地缓存中的Meta表信息；（第一次启动客户端为空）（2）向ZK发起读取Meta表所在位置的请求；（3）ZK正常返回Meta表所在位置；（4）向Meta表所在位置的RegionServer发起请求读取Meta表信息；（5）读取到Meta表信

2024年02月14日
浏览(33)
HBase写入流程详解

HBase采用LSM树架构，天生适用于写多读少的应用场景。在真实生产线环境中，也正是因为HBase集群出色的写入能力，才能支持当下很多数据激增的业务。需要说明的是，HBase服务端并没有提供update、delete接口，HBase中对数据的更新、删除操作在服务器端也认为是写入操作，不同

2024年02月14日
浏览(41)
Hbase面试题

序号内容链接地址 1 Java面试题 https://blog.csdn.net/golove666/article/details/137360180 2 JVM面试题 https://blog.csdn.net/golove666/article/details/137245795 3 Servlet面试题 https://blog.csdn.net/golove666/article/details/137395779 4 Maven面试题 https://blog.csdn.net/golove666/article/details/137365977 5 Git面试题 https://blog.csdn.n

2024年04月24日
浏览(26)
Hbase-面试题

自动切分，默认情况下 2.0版本，第一次region的数据达到256M，会进行切分，以后就是每达到10G切分一次，切分完成后，会进行负载均衡，均衡到其他regionserver 预分区+自定义rowkey 可以理解为预切分比如预分区，每个regionserver会有10个region，每个region都有startrow和endrow 生产上必

2024年02月13日
浏览(35)