centos7上hive3.1.3安装及配置

这篇具有很好参考价值的文章主要介绍了centos7上hive3.1.3安装及配置。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、安装背景;

hive是基于hadoop的数据仓库软件,部署运行在linux系统之上,安装之前必须保证hadoop环境运行正常,hive本身不是分布式软件,它的分布式主要是借助hadoop实现,存储是hdfs,计算是mapreduce。

需要同时安装apache-hive-3.1.3-bin.tar.gz和mysql-5.7.42-1.el7.x86_64.rpm-bundle.tar两个软件,因为hive的建表元数据需要保存到数据库中,共74张表,一般用mysql。

2、配置mysql;

Hive 允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持 Hive 的多会话生产环
境,在本案例中采用 MySQL 作为 Hive 的元数据存储库。

(1)先卸载centos7自带的mariadb数据库, 因为mariadb5.5版本与hive3.x存在兼容性问题。

# 查找centos7中是否有自带的mariadb数据库
rpm -qa|grep mariadb

# mariadb-libs-5.5.64-1.el7.x86_64

#卸载
rpm -e mariadb-libs-5.5.64-1.el7.x86_64 --nodeps

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(2)上传mysql-5.7.42-1.el7.x86_64.rpm-bundle.tar并解压;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

此处用“tar -zxvf mysql-5.7.42-1.el7.x86_64.rpm-bundle.tar -C /opt/server/mysql/”命令,会解压失败。

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

应该使用“tar xvf mysql-5.7.42-1.el7.x86_64.rpm-bundle.tar -C /opt/server/mysql/”,如下图;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(3)安装mysql5.7;

①安装必要的依赖包;

此处是在系统根目录安装,其他位置应该也可以。

# 安装依赖
yum -y install libaio
yum -y install libncurses*
yum -y install perl perl-devel

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

②安装mysql;

切换目录到“cd opt/server/mysql/”,执行下面四条命令;

# 安装mysql
rpm -ivh mysql-community-common-5.7.42-1.el7.x86_64.rpm 
rpm -ivh mysql-community-libs-5.7.42-1.el7.x86_64.rpm 
rpm -ivh mysql-community-client-5.7.42-1.el7.x86_64.rpm 
rpm -ivh mysql-community-server-5.7.42-1.el7.x86_64.rpm

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

安装net-tools依赖包;

yum -y install net-tools.x86_64

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

安装mysql-community-server.xxxxx.rpm;

rpm -ivh mysql-community-server-5.7.42-1.el7.x86_64.rpm

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(4)启动mysql;

# 启动mysql
systemctl start mysqld
#查看生成的临时root密码
cat /var/log/mysqld.log | grep password

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

2023-09-05T03:19:52.654819Z 1 [Note] A temporary password is generated for root@localhost: pRyujui?H9gD

(5)修改初始密码;

# 登录mysql
mysql -u root -p
Enter password:     #输入在日志中生成的临时密码

# 更新root密码 设置为sql2023
set global validate_password_policy=0;
set global validate_password_length=1;
set password=password('sql2023');

(6)远程授权;

# 其中 *.*代表对所有表进行授权;‘root’ 代表 root 用户;‘%’ 代表所有的外部 IP;‘sql2023’ 代表自己设置的用户密码。
grant all privileges on *.* to 'root' @'%' identified by 'sql2023';

# 刷新
flush privileges;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

退出mysql命令:"exit"

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(7)相关命令;

#mysql的启动和关闭 状态查看
systemctl stop mysqld
systemctl status mysqld
systemctl start mysqld

#建议设置为开机自启动服务
systemctl enable mysqld

#查看是否已经设置自启动成功
systemctl list-unit-files | grep mysqld

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

3、Hive安装和配置;

(1)上传hive安装包apache-hive-3.1.3-bin.tar.gz和mysql_jdbc驱动包mysql-connector-java-5.1.38.jar;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(2)解压hive安装包;

命令“tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /opt/server/”;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(3)添加mysql_jdbc驱动到hive安装包lib目录下;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(4)修改hive-env.sh,加入hadoop安装路径;

# 进入conf目录
[root@server apache-hive-3.1.3-bin]# cd ./conf

# 生成hive-env.sh文件
cp hive-env.sh.template hive-env.sh

#编辑hive-env.sh信息
vim hive-env.sh

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

# 加入hadoop路径
HADOOP_HOME=/opt/server/hadoop-3.3.1

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(5)新建 hive-site.xml 文件,内容如下,主要是配置存放元数据的 MySQL 的地址、驱动、用户名和密码等信息;

vim hive-site.xml

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 存储元数据mysql相关配置 /etc/hosts -->
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value> jdbc:mysql://server:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false&amp;useUnicode=true&amp;characterEncoding=UTF-8</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>sql2023</value>
    </property>
</configuration>

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(6)hive2j及以上版本,必须手动初始化元数据库;

# 进入bin目录
cd /opt/server/apache-hive-3.1.2-bin/bin

# 初始化元数据库命令
./schematool -dbType mysql -initSchema

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(7)添加hive环境变量;

#Hive
export HIVE_HOME=/opt/server/apache-hive-3.1.3-bin
export PATH=$PATH:${HIVE_HOME}/bin

centos7上hive3.1.3安装及配置,hive,数据仓库,mysqlcentos7上hive3.1.3安装及配置,hive,数据仓库,mysql

刷新,使其生效;

source ./etc/profile

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

(8)启动hive,测试功能;

# 连接hive
hive


# 创建数据库
create database test;
# 列出所有数据库
show databases;
# 切换数据库
use test;


# 建表
create table tb1(id int,name varchar(64));
# 插入一条数据
insert into table tb1 values(1,"wang");
# 查询表数据
select * from tb1;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysqlcentos7上hive3.1.3安装及配置,hive,数据仓库,mysqlcentos7上hive3.1.3安装及配置,hive,数据仓库,mysql

YARN有MapReduce程序执行;

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql

退出hive命令:"exit;"

centos7上hive3.1.3安装及配置,hive,数据仓库,mysql文章来源地址https://www.toymoban.com/news/detail-707927.html

到了这里,关于centos7上hive3.1.3安装及配置的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hive数据仓库---Hive的安装与配置

    Hive 官网地址:https://hive.apache.org/ 下载地址:http://www.apache.org/dyn/closer.cgi/hive/ 把安装文件apache-hive-3.1.2-bin.tar.gz上传到master节点的/opt/software目 录下,执行以下命令把安装文件解压到/opt/app目录中 进入/opt/app目录,为目录apache-hive-3.1.2-bin建立软件链接 即输入hive就相当于输入a

    2024年02月02日
    浏览(43)
  • openGauss数据库安装,配置连接 完整版Centos7

    服务器版本:Centos7.6 || 7.9 数据库版本:openGauss-5.0.0-CentOS-64bit.tar.bz2  极简版 目录 修改系统参数 安装环境 安装openGauss数据库 配置连接数据库 使用navicat连接数据库 ##修改 /etc/selinux/config 文件中的“SELINUX”值为“disabled”。 vi  /etc/selinux/config SELINUX=disabled 关闭防火墙 ##检查

    2024年02月09日
    浏览(47)
  • Ladp数据库安装和配置自定义schema ,Centos7环境

    最近安装ldap看了不少教程,整理下用到的有用的资料,并把自己的搭建过程分享。 ldap介绍:openLDAP入门与安装 官方文档:https://www.openldap.org/doc/admin22/schema.html 安装配置:Centos7 搭建openldap完整详细教程(真实可用) bug解决:ldap运维中遇到的问题 schema自定义:导入schema到openL

    2024年02月12日
    浏览(55)
  • Centos7安装Docker,安装DockerCompose(集群化部署),Docker私服镜像仓库

    Docker 分为 CE 和 EE 两大版本。CE 即社区版(免费,支持周期 7 个月),EE 即企业版,强调安全,付费使用,支持周期 24 个月。 Docker CE 分为 stable test 和 nightly 三个更新频道。 官方网站上有各种环境下的 安装指南,这里主要介绍 Docker CE 在 CentOS上的安装。 Docker CE 支持 64 位版

    2024年02月04日
    浏览(71)
  • Hive3 on Spark3配置

    大数据组件 版本 Hive 3.1.2 Spark spark-3.0.0-bin-hadoop3.2 OS 版本 MacOS Monterey 12.1 Linux - CentOS 7.6 1)Hive on Spark说明 Hive引擎包括:默认 mr 、 spark 、 Tez 。 Hive on Spark :Hive既作为存储元数据又负责SQL的解析优化,语法是HQL语法,执行引擎变成了Spark,Spark负责采用RDD执行。 Spark on Hive :

    2024年02月04日
    浏览(39)
  • hadoop3.2.1+hive3.1.2-docker安装

    建立hadoop用的内部网络(此步出错,若与其它网段冲突,可省略) #指定固定ip号段 建立Master容器,映射端口 10000端口为hiveserver2端口,后面本地客户端要通过beeline连接hive使用,有其他组件要安装的话可以提前把端口都映射出来 若创建了网段则可指定网段运行 创建slave1 172.17.

    2024年02月08日
    浏览(40)
  • Ubuntu下安装Hive3.1.2教程(附MySQL安装方法及安装包)

    Hive 的安装需要建立在 Hadoop 的之上(类似于Hbase) ,关于 Hadoop 的单机安装以及伪分布式安装可以参考作者的另两篇博客: Ubuntu下单机安装Hadoop详细教程(附所需安装包下载) Ubuntu下伪分布式安装Hadoop详细教程 本文安装的 Hadoop 及 Java 环境基于林子雨老师的《大数据技术原

    2024年02月04日
    浏览(51)
  • Centos7安装配置Tomcat

    本篇博客将演示 如何在linux环境下安装tomcat 和 介绍一些tomcat的知识,以及将tomcat配置成系统服务,来实现开机自启动等一系列功能,后续专栏将持续更新相关知识,期待的小伙伴不妨给小编点个关注,感谢! 环境介绍 本篇博客采用以下环境进行演示,要进行tomcat的使用,系统中一定要

    2024年02月01日
    浏览(50)
  • Centos7安装配置RabbitMQ

    在开始演示安装RabbitMQ前,小编决定先介绍一下前置知识,想看安装步骤的小伙伴可以直接跳过这个章节,本篇博客算是小编学习RabbitMQ的笔记,部分内容都是摘录的,如果有感兴趣的小伙伴可以私信小编,后续小编将会更新更多的关于RabbitMQ的知识,感兴趣的小伙伴可以点个订阅。 1

    2023年04月25日
    浏览(40)
  • 关于hive3多表leftjoin导致数据丢失问题及解决方案

    最近业务场景需要将一张大表通过name名字关联多个小表去获取他们的id,大表数据9000w,小表数据最大180w,最小30w,我以主表leftjoin的时候发现了数据丢失问题 代码如下  结果显示数据我t7的数据由180w剩下9w,发生了严重的数据丢失,在别的表也有不同程度的丢失问题. 最后发现这个问

    2024年02月15日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包