Hive、Hbase、TiDB、Gbase的区别

这篇具有很好参考价值的文章主要介绍了Hive、Hbase、TiDB、Gbase的区别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  • 在数据库不断发展的今天,尤其是大数据技术的发展,不断的涌现出各种海量数据存储及分析的数据库及相关工具令人演化缭乱,有的基于Hadoop构建,有的基于分布式理论自行构建,但是这些工具和数据库之间究竟有什么区别,都使用于什么场景,在查询了相关材料之后我进行了一个简单的总结,以备后用。仅供参考。
  • 1、Hive(基于Hadoop数据仓库工具)
    • Hive是一种类Sql的引擎,并且运行MapReduce的任务。是将类似SQL的语句转换成MapReduce的任务进行执行;
    • Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类似SQL查询的功能;
    • Hive是一个基于hadoop的数据分析工具,证明Hive没有数据存储的能力,只有使用数据的能力;将结构化的数据文件映射为一张数据库表,结构化是Hive对存储在HDFS上的的数据的一个要求,其他文件是不能映射为Hive表的,而它提供的是类SQL的查询功能,不提供增删改的功能;所以HQL及Hive Query Language;Hive是现有数据,再定义表结构,将表结构同结构化数据文件进行映射;
    • Hive基于MapReduce计算模型,数据计算效率低,不适合在线的实时性要求较高的应用,适合非实时的离线计算;Hive默认是基于MapReduce计算模型,也可以切换为Spark计算效率较高的计算模型;
    • Hive的出现本身是为了简化MapReduce数据处理程序的开发,Hive提供类HQL(类SQL)语句,使得原来熟悉数据库SQL开发人员可以很容易上手使用HQL开发大规模数据量的处理程序。Hive引擎最终会将HQL转换为MapReduce的程序在Hadoop存储的数据上进行执行。
  • 2、Hbase(NoSql数据库)
    • Hbase是基于hadoop存储的KV型的列式数据库;
    • Hbase不支持标准的SQL访问,只能通过API的方式,由应用程序集成API SDK进行访问,可以建表,针对表做数据的增、删、改、查;
    • Hbase不支持数据表之间的外键约束及连接查询,如需要多表连接关联查询,Hbase可以搭建好之后,定义宽表,将OLTP应用中的数据记录进行拼接整合在一起,然后对前提供快速的查询、聚合分析服务。
    • Hbase可以存储百亿行的数据,适合高并发的大流量的数据写入,由于是列式存储,对于OLAP通过某一些列的统计计算支持有很好的支持,支持实时的数据统计分析场景。
  • 3、TiDB(NewSql数据库 HTAP数据库、关系型数据库)
    • TiDB是一个NewSql分布式,也就是同时支持OLTP和OLAP混合型数据库;
    • TiDB采用了计算、存储分离的分布式架构,计算和存储可以按需独立横向扩展;
    • 数据存储方面,TiDB采用了多副本的数据存储架构,保证了数据的高可用性,即一部分数据节点副本出现问题,也不会影响整体数据库集群对外提供服务;
    • TiDB提供了TiKV 行存储引擎和TiFlash 列存储引擎,两个存储引擎; TiFlash使用 Muti-Raft Learner协议实时从TiKV复制数据,确保两个引擎之间的数据一致性;TiKV和TiFlash可以按需部署在不同的机器,解决HTAP资源隔离的问题;
    • TiDB兼容MySQL 5.7协议及Mysql生态,可以使用JDBC的方式直接访问,但是暂不支持触发器、存储过程、自定义函数等功能;
    • TiDB核心应用场景:对数据一致性、高可靠、高可用、可扩展、容灾要求较高的金融行业属性场景(具体上生产使用还需要进行严厉性能的POC测试);对存储容量、并发性、可扩展性要求较高的海量数据及高并发的OLTP应用;Real-Time的HTAP场景,Tidb在4.0版本引入了TiFlash列存储引擎结合TiKV行存储引擎构件真正的HTAP混合场景数据库,在增加少量存储成本的情况下,可以在同一个系统中做联机交易处理、实时数据分析;还有就是适合做数据汇聚、二次加工的场景;
  • 4、Gbase8a(关系型数据库、MPP数据库)
    • MPP Massively Parallel Processing 大规模并行处理,是一种计算处理模型,是从系统架构角度服务器分类的方法,是将任务并行的分散到多个服务器节点上,在每个节点上计算完成后,将各自部分的结果汇总到一起得到最终的结果。跟Hadoop计算模型类似)
    • 专门支持海量数据的存储、关联查询、即席分析等能力,主要支持结构化的数据SQL查询;
    • 适用场景主要是报表统计分析,运维数据统计,快速生成报表统计等场景;不需要频繁更新数据,不需要频繁重复离线计算,不需要并发大;

文章来源地址https://www.toymoban.com/news/detail-472059.html

到了这里,关于Hive、Hbase、TiDB、Gbase的区别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GBASE南大通用数据库GBase 8s常见问题讲堂 -- 字符集的设置

    本文摘自GBASE南大通用社区,by:wty,原文请点击:GBase 8s常见问题 -- 字符集相关问题|GBASE社区|天津南大通用数据技术股份有限公司|GBASE-致力于成为用户最信赖的数据库产品供应商 23103   Code-set conversion function failed due to an illegal sequence or invalid value. 字符集转换失败,字符串中

    2024年01月24日
    浏览(50)
  • 三种Python操作GBase 8s数据库数据类型的差异

    Python可以通过多种方式操作GBase 8s数据库,常见的类型包括DbtPy(原生)、Pyodbc(ODBC方式)和JayDeBeApi(调用jdbc)。以下是这三种操作方式对GBase 8s数据库的数据类型支持的对比 类型 数据类型 DbtPy Pyodbc JayDeBeApi(jdbc) 字符类型 CHAR(N) 是 是 是 字符类型 NCHAR(N) 是 是 是 字符类型 VARCHAR(N)

    2023年04月09日
    浏览(31)
  • GBASE南大通用 访问其他数据库服务器

    通过限定数据库对象(表、视图、同义词或例程)的名称,您可访问外部数据库中的任何 表或例程。 当外部表与当前数据库位于同一数据库服务器上时,您必须以数据库名称和冒号限定对象 名称。例如,要引用不是本地数据库的数据库中的表,下列 SELECT 语句访问来自外部

    2024年01月23日
    浏览(36)
  • GBASE南大通用分析型MPP数据库GBase8a的安全特性(1)

    GBase南大通用自主研发的 GBase 8a MPP Cluster 产品(简称GBase8a)是大数据时代成熟的分析型MPP数据库,具有多样化的平台选择、与时俱进的逻辑架构、海量数据高效存储、海量数据高速加载、海量数据高性能分析、弹性服务器资源伸缩、完善的系统资源管理、多级别的高可用、跨

    2024年01月25日
    浏览(31)
  • GBASE南大通用分析型MPP数据库GBase8a的安全特性(2)

    GBase南大通用自主研发的 GBase 8a MPP Cluster 产品(简称GBase8a)是大数据时代成熟的分析型MPP数据库,具有多样化的平台选择、与时俱进的逻辑架构、海量数据高效存储、海量数据高速加载、海量数据高性能分析、弹性服务器资源伸缩、完善的系统资源管理、多级别的高可用、跨

    2024年01月25日
    浏览(38)
  • 面向海量异构数据分析的GBASE南大通用数据库

    GBaseBI V5是GBASE南大通用公司面向海量异构数据分析,以独特的语义映射和内存计算为基础,以“可视化”展示为重点的一款高性能数据分析平台;具备满足企事业单位对KPI指标监控、数据预测、数据预警、数据汇总和数据可视化展示等需求的能力。 GBaseBI V5整体采用B/S构架,

    2024年01月19日
    浏览(73)
  • 南大通用数据库(Gbase 8s) 创建UDR外部函数

    一、在使用 date_format、from_unixtime、to_days、yearweek 函数时,Gbase 8s 数据库不支持,可以使用创建 UDR 外部函数来实现 二、登录命令控制台或者使用 navicat 连接 Gbase 数据库 这里使用 navicat ,点击新增连接选择 PostGreSql 驱动,添加地址、账号、密码 连接数据库后,选中目标库选

    2024年02月12日
    浏览(33)
  • tidb数据库的安装与部署

      TiDB  是  PingCAP  公司自主设计、研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式数据库产品,具备水平扩容或者缩容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容 MySQL

    2024年02月04日
    浏览(30)
  • Django如何删除数据库表中的数据【不断积累】

    这篇博客积累Django的数据库常用删除方法。 假设有表模型Author定义如下: Django 默认为每个模型添加一个名为 id 的自增主键列,用于唯一标识每条记录。因此,可以使用该 id 值来删除指定的记录。 下面是使用 id 值删除记录的示例代码: 在这个示例中,我们首先指定要删除

    2024年02月13日
    浏览(42)
  • [Lesson 01] TiDB数据库架构概述

    目录 一 章节目标  二 TiDB 体系结构  1 TiDB Server 2.1 TiKV 2.2 TiFlash 3 PD 参考  理解TiDB数据库整体架构 了解TiDB Server ,TiKV ,TiFlash 和 PD的主要功能 了解这些体系结构是如何实现TiDB的核心功能的 TiDB Server 是无状态的,所以可以结合负载均衡的组件LVS。 数据并不是存储在TiDB Ser

    2024年02月16日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包