Hive 3.x的安装部署 - Ubuntu

这篇具有很好参考价值的文章主要介绍了Hive 3.x的安装部署 - Ubuntu。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。同时,博主也想通过此次尝试打造一个完善的技术图书馆,任何与文章技术点有关的异常、错误、注意事项均会在末尾列出,欢迎大家通过各种方式提供素材。

  • 对于文章中出现的任何错误请大家批评指出,一定及时修改。
  • 有任何想要讨论和学习的问题可联系我:zhuyc@vip.163.com。
  • 发布文章的风格因专栏而异,均自成体系,不足之处请大家指正。

Hive 3.x的安装部署 - Ubuntu

本文关键字:Hive、安装、部署、Linux、Ubuntu

一、Hive简介

1. 什么是Hive

Hive是一个基于Hadoop的数据仓库解决方案,用于存储和处理大规模数据。它提供了类似SQL的查询语言(HiveQL)以便于分析和查询数据。
ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

2. Hive的特性

  • Hive特点
    • HiveQL【SQL-like查询语言】
    • 存储和计算分离
    • 可扩展性和容错性
    • 数据仓库功能
    • 自定义函数和自定义聚合函数
  • Hive3新特性
    • 事务支持
    • 性能优化
    • 安全性增强
    • 添加数据湖功能
    • 更多数据类型和函数

二、Hive安装

1. 前置环境

  • Hive本身的运行需要JDK环境
  • Hive需要将数据存储在HDFS
  • Hive需要将元数据存储在关系型数据库

2. 下载安装

  • 软件下载:https://hive.apache.org/general/downloads/

ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

  • 镜像地址:https://www.apache.org/dyn/closer.cgi/hive/

ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

  • 选择版本

ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop
点击选择需要的版本,可以使用wget直接下载到Linux系统。
ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

3. 软件配置

  • 解压安装
tar -zvxf apache-hive-3.1.3-bin.tar.gz
  • 环境变量配置

编辑.bashrc文件,修改并保存

export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin
export PATH=$PATH:$HIVE_HOME/bin

退出后使用source命令刷新

source ~/.bashrc

三、启动验证

1. 元数据初始化

Hive在使用前需要将元数据保存在关系型数据库中,将表数据保存在HDFS,需要保证对应服务开启。

  • Hadoop 3.x各模式部署 - Ubuntu
  • Ubuntu安装MySQL 8.0 - APT(结尾附视频)
  • 下载驱动Jar包

这里以MySQL为例,如果使用该数据库作为元数据存储位置,需要使得Hive能够连接到数据库,因此需要在lib目录下放入驱动jar包:

cd $HIVE_HOME/lib
wget https://repo1.maven.org/maven2/com/mysql/mysql-connector-j/8.0.32/mysql-connector-j-8.0.32.jar
  • 编辑配置文件

在Hive的配置文件中需要指定MySQL的连接信息,包括连接地址、用户名以及密码等:

cd $HIVE_HOME/conf
# 创建一个新的hive-site.xml
vi hive-site.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive_metastore?createDatabaseIfNotExist=true&amp;useSSL=false&amp;serverTimezone=UTC</value>
    <description>Metadata store connection URL</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.cj.jdbc.Driver</value>
    <description>Metadata store JDBC driver</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
    <description>Metadata store username</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>root</value>
    <description>Metadata store password</description>
  </property>
</configuration>
  • 执行初始化脚本
schematool -initSchema -dbType mysql

ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop
结尾会出现Initialization script completedschemaTool completed证明成功。

2. 启动测试

在Hive安装完成后,可以使用hive命令直接开启一个连接,默认会出现一个default数据库:
ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

3. HiveServer2与Beeline

完成以上步骤后,已经可以随时通过客户端命令对Hive进行访问,但是很多时候我们需要基于Hive进行开发或在代码中进行访问。此时,需要开启hiveserver2服务,能够方便的处理客户端发起的连接。

  • HiveServer2主要作用

处理来自客户端的连接和请求;执行客户端提交的查询;支持多用户并发操作和认证;提供 JDBC/ODBC 接口,使外部应用程序和工具能够访问 Hive 数据仓库。

  • Beeline介绍

Beeline 是一个基于 JDBC 的 Hive 客户端工具,用于连接到 HiveServer2 并执行查询。它采用命令行界面,用户可以在命令行中输入 SQL 查询并查看结果。通常我们会使用Beeline来测试HiveServer2服务是否正常工作。

  • 开启远程连接

可以使用以下命令开启一个HiveServer2服务,监听10000端口,允许来自任意地址的机器进行远程连接。

nohup hive --service hiveserver2 --hiveconf hive.server2.thrift.bind.host=0.0.0.0 --hiveconf hive.server2.thrift.port=10000 &

也可以将以上命令中出现的两个配置写入到hive-site.xml文件中,在启动时即可省略。

  • 开启代理权限

开启远程连接后,需要在Hadoop中配置代理用户,或是允许所有用户都可以连接,修改core-site.xml文件:

<property>
  <name>hadoop.proxyuser.hadoop.hosts</name>
  <value>*</value>
</property>
<property>
  <name>hadoop.proxyuser.hadoop.groups</name>
  <value>*</value>
</property>

其中proxyuser后面的名称需要实际替换为启动Hadoop进程的用户,如:hadoop。

修改配置文件后要重启Hadoop服务,如果是分布式集群,需要同步配置文件。

  • Beeline测试

开启HiveServer2服务后,使用以下命令进行连接测试

beeline -u jdbc:hive2://hadoop:10000

ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop

退出时使用 !quit

扫描下方二维码,加入CSDN官方粉丝微信群,可以与我直接交流,还有更多福利哦~
ubuntu安装hive,萌新科普,# 环境搭建,hive,ubuntu,hadoop文章来源地址https://www.toymoban.com/news/detail-771083.html

到了这里,关于Hive 3.x的安装部署 - Ubuntu的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 单机搭建hadoop环境(包括hdfs、yarn、hive)

    单机可以搭建伪分布式hadoop环境,用来测试和开发使用,hadoop包括: hdfs服务器, yarn服务器,yarn的前提是hdfs服务器, 在前面两个的基础上,课可以搭建hive服务器,不过hive不属于hadoop的必须部分。 过程不要想的太复杂,其实挺简单,这里用最糙最快最直接的方法,在我的单

    2024年02月20日
    浏览(50)
  • 大数据环境搭建 Hadoop+Hive+Flume+Sqoop+Azkaban

    Hadoop:3.1.0 CentOS:7.6 JDK:1.8 这里网上教程很多,就不贴图了 【内存可以尽量大一些,不然Hive运行时内存不够】 创建tools目录,用于存放文件安装包 将Hadoop和JDK的安装包上传上去 创建server目录,存放解压后的文件 解压jdk 配置环境变量 配置免密登录 配置映射,配置ip地址和

    2024年02月09日
    浏览(39)
  • 大数据平台环境搭建---- Hive&MySql数据库组件配置

    前置环境 Hadoop集群必须部署完成,如果还没有搭建请先前往Hadoop全分布搭建笔记 程序版本 hive 1.1.0 mysql 5.7.25 mysql-connector-java-5.1.39-bin.jar 资源下载 官网下载: mysql-5.7.25-1.el7.x86_64.rpm-bundle.tar :https://downloads.mysql.com/archives/community/  链接:https://pan.xunlei.com/s/VNoQg4wdxda5by6L8Lvug9e

    2024年01月25日
    浏览(61)
  • hive环境安装

    上一篇已经把hadoop环境搭建完成了,基于上一篇的Linux环境,把hive环境安装一下; 一、hive安装步骤 1、到hive官网上hive官网(Apache Hive)下载hive,(下载hive的时候,需要注意跟hadoop的版本兼容问题,一般hadoop是3.x.x,hive的版本也是3.x.x)         2、把下载的hive上传到服务器上

    2024年02月09日
    浏览(35)
  • hive on spark集群环境部署(彻底摆脱做毕设没环境)

     1.1.1所需下载的rpm包  1.1.2所需驱动包下载 1.3.1卸载干扰依赖 1.3.2安装所需的依赖 1.4.1切换root用户  1.4.2执行脚本 1.4.3脚本解析 1.4.4退出root用户到student用户 1.4.5登录测试 2.1.1把hive-3.1.3.tar.gz上传到linux的/opt/software目录下 2.1.2 解压hive-3.1.3.tar.gz到/opt/module/目录下面 2.1.3 修改h

    2024年02月04日
    浏览(45)
  • Hive安装部署

    1、Hive安装地址 ①Hive官网地址 Apache Hive ②文档查看地址 GettingStarted - Apache Hive - Apache Software Foundation ③下载地址 Index of /dist/hive ④github地址 GitHub - apache/hive: Apache Hive 2、 安装Hive 1)把apache-hive-3.1.3-bin.tar.gz上传到Linux的/opt/software目录下 2)解压apache-hive-3.1.3-bin.tar.gz到/opt/mod

    2024年02月06日
    浏览(39)
  • Apache Hive安装部署

    描述数据的数据,主要描述数据属性信息,用来支持如指示存储位置,历史数据,资源查找,文件记录等功能。 存储在关系型数据库中。如hive内置Derby,或第三方MySql Metastore元数据服务。作用管理元数据,对外暴露服务。 metastore服务配置三种模式: 内嵌模式 本地模式 远程

    2024年02月09日
    浏览(38)
  • hive安装和部署

    1.Hive官网地址 Apache Hive 2.文档查看地址 GettingStarted - Apache Hive - Apache Software Foundation 3.下载地址 Index of /dist/hive 4.github地址 GitHub - apache/hive: Apache Hive   1.服务器的基础环境 集群时间同步、防火墙关闭、主机Host映射、免密登录、JDK安装   2.Hadoop集群健康可用   启动Hive之前

    2024年02月05日
    浏览(54)
  • hadoop集群搭建+hive安装

    VMware-workstation:VMware-workstation-full-16.2.3 ubuntu:ubuntu-21.10 hadoop:hadoop2.7.2 mysql:mysql-connector-java-8.0.19 jdk:jdk-8u91-linux-x64.tar(注意要是linux版本的,因为是在linux系统中创建虚拟机) hive:hive1.2.1 小技巧: 右键单击可以paste 1.选择典型即可 2.将ubuntu镜像文件导入: 3.用户名要记住

    2024年02月05日
    浏览(101)
  • 大数据学习:Hive安装部署

    注意hive就是 一个构建数据仓库的工具 ,只需要在 一台服务器上 安装就可以了,不需要在多台服务器上安装。 此处以安装到node03为例; 请大家保持统一 使用 hadoop普通用户 操作 1.1 先决条件 搭建好三节点Hadoop集群; node03上先安装好MySQL服务; 1.2 准备安装包 下载hive的安装

    2024年02月10日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包