《Hadoop核心技术》Hbase集群部署,创建表,删除表,插入数据,查询数据

这篇具有很好参考价值的文章主要介绍了《Hadoop核心技术》Hbase集群部署,创建表,删除表,插入数据,查询数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

额前言:

        我是一名正在学习《Hadoop核心技术》的学生,今天跟大家分享一下在虚拟机上在Hadoop集群中用Hbase进行简单的增删查

一.什么是Hbase?

可以进行随机访问的存取和检索数据的存储平台

        HBase 是一个开源的、分布式的、版本化的 NoSQL 数据库(也即非关系型数据库),它利用 Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)提供分布式数据存储。与传统的关系型数据库类似,HBase 也以表的形式组织数据,表也由行和列组成;不同的是,HBase 有列族的概念,它将一列或者多列组织在一起,HBase 的每一个列都必须属于某个列族。

        HBase 是一个可以进行随机访问的存取和检索数据的存储平台,存储结构化和半结构化的数据,因此一般的网站可以将网页内容和日志信息都存在 HBase 里。

        如果数据量不是非常庞大,HBase 甚至可以存储非结构化的数据。它不要求数据有预定义的模式,允许动态和灵活的数据模型,也不限制存储数据的类型。

        HBase 是非关系型数据库,它不具备关系型数据库的一些特点,例如,它不支持 SQL 的跨行事务,也不要求数据之间有严格的关系,同时它允许在同一列的不同行中存储不同类型的数据。

        HBase 作为 Hadoop 框架下的数据库,是被设计成在一个服务器集群上运行的

二.Hbase环境部署:

VMware虚拟机

1.集群部署:

看到HMaster为成功

hbase增删改查,hbase,hadoop,数据库

 

2..启动Hbase:

hbase shell

hbase增删改查,hbase,hadoop,数据库

三:Hbase创建表 

        首先先用List命令查看当前表:

list

hbase增删改查,hbase,hadoop,数据库

 可以看到当前是没有表的

创建学生表代码:

create 'student','basic_info','office'

hbase增删改查,hbase,hadoop,数据库

        用create命令创建表,参数之间用逗号隔开。第一个参数是表名,要用单引号括起来,第二个参数及之后的参数,指定列族,如果不修改列族默认属性,那么指定列族名即可,用单引号括起来。 最后用List命令查看表发现已经创建了student表

四.删除表

删除表前,先用disable命令

disable 'student'

然后使用drop命令删除掉

drop 'student'

hbase增删改查,hbase,hadoop,数据库

五.插入数据:

前面删掉了student表,现在重建

create 'student',{NAME=>'basic_info', VERSIONS=>3},'office'

用put插入一条记录

get命令可以查看指定表的某个row key的所有列的单元格最新版本的值

 put 'student','student-0001','basic_info:name','ligl1',1

 get 'student','student-0001'

 

 

六.数据查询

1.清空表数据

truncate 'student'

2.插入几条数据

put 'student','student-0001','basic_info:name','ligl1'
put 'student','student-0001','basic_info:name','ligl2'
put 'student','student-0001','basic_info:name','ligl3'
put 'student','student-0001','basic_info:age','18'

3.scan查看学生表所有数据

scan 'student'

hbase增删改查,hbase,hadoop,数据库

 

七.问题解决

hbase增删改查,hbase,hadoop,数据库

不能直接使用create + 表命建表,需要在后面加入列族,特别注意! 

六.学习心得

        在学习Hadoop的过程中,我收获了很多宝贵的经验和知识。首先,我了解到Hadoop是一个开源的分布式计算框架,用于处理大规模数据集的存储和分析。通过学习Hadoop,我深入理解了大数据处理的原理和方法。

        其次,我学会了如何搭建和配置Hadoop集群。Hadoop集群由多台服务器组成,每台服务器承担不同的角色,例如NameNode、DataNode、ResourceManager等。通过学习Hadoop的架构和配置文件,我能够搭建一个稳定高效的Hadoop集群,并对其进行灵活调整和优化。

        另外,在使用Hadoop进行数据处理时,我学会了使用MapReduce编程模型。MapReduce是Hadoop提供的一种并行计算模型,通过将问题划分为Map阶段和Reduce阶段用分布式计算资源来加速数据处理过程。通过编写MapReduce程序,我可以灵活地处理各种复杂的数据分析任务。

        此外,在学习Hadoop过程中还接触到了其他相关技术,例如Hive、Pig、Spark等。这些技术都是基于Hadoop生态系统发展起来的工具或框架,可以进一步简化大数据处理流程,并提供更高级别的抽象和功能。

        总结起来,学习Hadoop让我深入了解了大数据处理的原理和方法,掌握了搭建和配置Hadoop集群的技能,以及使用MapReduce程模型进行数据处理的能力。这些收获将对职业发展产生重要的影响,并使我能够更好地应对日益增长的大数据挑战!文章来源地址https://www.toymoban.com/news/detail-775445.html

到了这里,关于《Hadoop核心技术》Hbase集群部署,创建表,删除表,插入数据,查询数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【报错-大数据技术-Hbase & Ranger】hbase创建、删除(表、命名空间)无权限问题,但是向表put、get、scan数据报错

    1、问题描述 使用hbase shell执行创建命名空间、创建表、插入数据、获取数据、查看数据、删除命名空间、删除表等命令操作,发现可以创建命名空间、创建表、删除命名空间、删除表,但是插入数据、获取数据、查看数据等操作却报没有权限的问题,但是我已在Ranger上赋予用

    2024年03月15日
    浏览(87)
  • 大数据技术之Hadoop:Yarn集群部署(七)

    目录 一、部署说明 二、集群规划 三、开始配置 3.1 MapReduce配置文件 3.2 YARN配置文件 3.3 分发配置文件 四、集群启停 4.1 命令介绍  4.2 演示 4.3 查看YARN的WEB UI页面 Hadoop HDFS分布式文件系统,我们会启动: NameNode进程作为管理节点 DataNode进程作为工作节点 SecondaryNamenode作为辅

    2024年02月09日
    浏览(55)
  • 虚拟机安装hadoop,hbase(单机伪集群模式)

    工作中遇到了大数据方面的一些技术栈,没有退路可言,只能去学习掌握它,就像当初做爬虫一样(虽然很简单),在数据爆发的现在,传统的数据库mysql,oracle显然在处理大数据量级的数据时显得力不从心,所以有些特定的业务需要引进能够处理大数据量的数据库,hadoop提

    2024年02月04日
    浏览(37)
  • 大数据Hadoop集群之超级详细的HBase搭建

    Hbase是基于Hadoop集群之上来搭建的 Hadoop有一些局限性: 做一些批量的数据处理,吞吐量比较高,但是它对随机查询、实时操作性能是不行的 HBase是NoSQL数据库的一种,它跟传统的RDBMS有很大的差别 不支持JOIN的,摒弃了关系型模型,而且在HBase中只有一种数据类型:byte[] HBase可

    2023年04月13日
    浏览(83)
  • 大数据技术栈-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超详细-小白注释版)虚拟机安装+平台部署

    目录 环境条件: 1、安装虚拟机(已安装好虚拟机的可跳转至  二、安装JDK与Hadoop) (1)直接新建一台虚拟机 (2)首次启用虚拟机,进行安装 一、集群前置环境搭建(三台机器分别设置hostname、网卡(ip)配置、ssh免密登录) 1、查看一下本机与虚拟机的网卡和ip信息 (1)

    2024年02月06日
    浏览(46)
  • 云计算集群搭建记录[Hadoop|Zookeeper|Hbase|Spark | Docker |OpenStack]更新索引 |动态更新

    为了能够更好的查看所更新的文章,讲该博文设为索引 为了解决在编辑文件等操作的过程中的权限问题,博主一律 默认采用 root 账户登录 对于初次安装的用户可以采用如下命令行: 另外推荐一款终端工具:Tabby,既能够连接自己的服务器,也能够连接自己本地的虚拟机,还

    2023年04月13日
    浏览(54)
  • HBase集群部署

    相关版本:Hadoop:2.7.3 hbase:1.3.1 hbase相关版本下载 安装HBase需要安装hbase-1.3.1-bin.tar.gz软件包,下载并解压到/opt目录下 2.1 修改Master节点和Slave节点的/etc/hosts文件 添加以下内容: 2. 2修改Master节点和Slave节点的/root/.bash_profile文件 添加内容如下 如图所示: 3修改配置文件hbase-en

    2024年02月19日
    浏览(37)
  • HBase学习三:集群部署

    集群启停顺序:启动Hadoop—启动HBase—关闭HBase—关闭Hadoop 参考基础环境配置 hostname ip vm1 ip1 vm2 ip2 vm3 ip3 hdfs的集群搭建可以参考 hdfs集群搭建 hdfs集群机器分配 NameNode DataNode JournalNode Zookeeper vm1 ✔ ✔ ✔ ✔ vm2 ✔ ✔ ✔ ✔ vm3 × ✔ ✔ ✔

    2024年01月18日
    浏览(36)
  • 【hadoop】hbase的安装部署以及相关操作(图文详解)

    ​ HBase是一种基于列存储的分布式数据库系统,它能够快速地存储和处理大规模数据。与传统的关系型数据库不同,HBase采用了分布式的架构,能够实现数据的高可靠性、高可扩展性和高性能。在实际应用中,正确地安装和部署HBase集群是非常重要的。 在安装hbase之前,需要虚

    2024年02月04日
    浏览(42)
  • 【数据结构】单链表基本操作:查找、插入、删除、创建

     链表由结点组成,结点由数据域和指针域组成。其中,数据域存放的就是数据元素,指针域存放下一个结点的地址。数据元素可以只有一个,也可以有多个不同类型的数据元素,甚至是数组。下图和代码来自《C Primer Plus》,该链表每个节结点同时含char类型和int类型。 ​​

    2024年02月02日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包