大数据平台环境搭建---- Hive&MySql数据库组件配置

这篇具有很好参考价值的文章主要介绍了大数据平台环境搭建---- Hive&MySql数据库组件配置。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前置环境

Hadoop集群必须部署完成,如果还没有搭建请先前往>>Hadoop全分布搭建笔记

程序版本

hive 1.1.0 mysql 5.7.25 mysql-connector-java-5.1.39-bin.jar

资源下载

官网下载:

mysql-5.7.25-1.el7.x86_64.rpm-bundle.tar:https://downloads.mysql.com/archives/community/ 

链接:https://pan.xunlei.com/s/VNoQg4wdxda5by6L8Lvug9erA1?pwd=y9tf#

提取码:y9tf

组件介绍

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。

操作流程

部署Hive前建议先更换系统自带的数据库,以免对后续的部署造成影响

部署Hive时需要更改Hadoop中的驱动文件,最好先停止Hadoop集群,避免出现异常

上传程序文件

使用FTP工具(xftp)上传Hive的程序包到master

[root@master ~]# ls

apache-hive-1.1.0-bin.tar.gz              mysql-connector-java-5.1.39-bin.jar

mysql-5.7.25-1.el7.x86_64.rpm-bundle.tar

更换数据库

查询出旧版数据库的名称以及版本并删除数据库

# 查询旧版数据库

[root@master ~]# rpm -qa | grep mariadb

mariadb-libs-5.5.68-1.el7.x86_64

# yum remove 删除旧版数据库

[root@master ~]# yum -y remove mariadb-libs-5.5.68-1.el7.x86_64

已加载插件:fastestmirror

......

完毕!

解压MySql数据库

# 创建解压目录

[root@master ~]# mkdir /opt/data

# 解压MySql

解压方式:xf (不显示解压过程)        -xvf(显示解压过程)        

[root@master ~]# tar xf mysql-5.7.25-1.el7.x86_64.rpm-bundle.tar -C /opt/data/

# 进入解压后的目录

[root@master ~]# cd /opt/data/

# 查看解压出来的文件是否正确

[root@master data]# ls

mysql-community-client-5.7.25-1.el7.x86_64.rpm

mysql-community-common-5.7.25-1.el7.x86_64.rpm

mysql-community-devel-5.7.25-1.el7.x86_64.rpm

mysql-community-embedded-5.7.25-1.el7.x86_64.rpm

mysql-community-embedded-compat-5.7.25-1.el7.x86_64.rpm

mysql-community-embedded-devel-5.7.25-1.el7.x86_64.rpm

mysql-community-libs-5.7.25-1.el7.x86_64.rpm

mysql-community-libs-compat-5.7.25-1.el7.x86_64.rpm

mysql-community-server-5.7.25-1.el7.x86_64.rpm

mysql-community-test-5.7.25-1.el7.x86_64.rpm

安装MySql数据库,最好按照下面的顺序进行安装MySql数据库

[root@master data]# rpm -i mysql-community-common-5.7.25-1.el7.x86_64.rpm 

警告:mysql-community-common-5.7.25-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY

[root@master data]# rpm -i mysql-community-libs-5.7.25-1.el7.x86_64.rpm 

警告:mysql-community-libs-5.7.25-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY

[root@master data]# rpm -i mysql-community-client-5.7.25-1.el7.x86_64.rpm 

警告:mysql-community-client-5.7.25-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY

[root@master data]# rpm -i mysql-community-server-5.7.25-1.el7.x86_64.rpm --force --nodeps

警告:mysql-community-server-5.7.25-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY

MySql服务初始化配置

# 查看MySql服务运行状态,如果在运行,请先停止该服务

[root@master data]# systemctl status mysqld

# 停止MySql服务

[root@master data]# systemctl stop mysqld

# 初始化MySql服务

[root@master data]# mysqld --initialize --console

# 查看MySql生成的登录密码

[root@master data]# cat /var/log/mysqld.log 

......

2021-03-18T09:59:50.605512Z 1 [Note] A temporary password is generated for root@localhost: L)hjW7aQqhYl

我这里的密码为:L)hjW7aQqhYl 

更改目录所有权:chown -R mysql:mysql /var/lib/mysql

[root@master data]# chown -R mysql:mysql /var/lib/mysql

启动MySql服务:systemctl start mysqld

[root@master data]# systemctl start mysqld

​​​​​​​

使用初始密码登录MySql

[root@master data]# mysql -uroot -p

Enter password: L)hjW7aQqhYl 

Welcome to the MySQL monitor.  Commands end with ; or \g.

......

mysql>

进行一些必要的设置

# 修改MySql密码为:123456

mysql> alter user 'root'@'localhost' identified by '123456';

Query OK, 0 rows affected (0.00 sec)

# 设置访问权限,否则Hive将无法连接到MySql

mysql> grant all privileges on *.* to 'root'@'%' identified by '123456';

Query OK, 0 rows affected, 1 warning (0.00 sec)

# 配置完成,退出Mysql

mysql> exit;

Bye

至此——MySql数据库配置完成

解压Hive

[root@master ~]# tar xf apache-hive-1.1.0-bin.tar.gz -C /usr/local/src/

# 解压后,cd进入Hive解压目录

[root@master ~]# cd /usr/local/src/

[root@master src]# ls

apache-hive-1.1.0-bin  hadoop  jdk

# 修改Hive文件夹名称

[root@master src]# mv apache-hive-1.1.0-bin/ hive

[root@master src]# ls

hadoop  hive  jdk

配置环境变量

使环境变量仅对root用户生效,编辑root用户的环境变量

[root@master src]# vi /root/.bash_profile 

修改后的文件状态

# .bash_profile



# Get the aliases and functions

if [ -f ~/.bashrc ]; then

        . ~/.bashrc

fi



# User specific environment and startup programs



JAVA_HOME=/usr/local/src/jdk

HADOOP_HOME=/usr/local/src/hadoop

HIVE_HOME=/usr/local/src/hive



PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin



export PATH

生效环境变量

[root@master src]# source /root/.bash_profile

配置Hive

进入Hive配置目录:cd /usr/local/src/hive/conf/

新建Hive配置文件:touch hive-site.xml

编辑Hive配置文件:vi hive-site.xml

<configuration>

        <property>

                <name>javax.jdo.option.ConnectionURL</name>

                <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true&useSSL=false</value>

        </property>

        <property>

                <name>javax.jdo.option.ConnectionDriverName</name>

                <value>com.mysql.jdbc.Driver</value>

        </property>

        <property>

                <name>javax.jdo.option.ConnectionUserName</name>

                <value>root</value>

        </property>

        <property>

                <name>javax.jdo.option.ConnectionPassword</name>

                <value>123456</value>

        </property>

</configuration>

复制MySql驱动包到Hive驱动目录下:

cp /root/mysql-connector-java-5.1.39-bin.jar /usr/local/src/hive/lib/

删除Hadoop Yarn驱动目录下的旧版jline.jar:

rm -f /usr/local/src/hadoop/share/hadoop/yarn/lib/jline-0.9.94.jar

将Hive驱动目录下的jline.jar复制到Yarn驱动目录下:

cp /usr/local/src/hive/lib/jline-2.12.jar /usr/local/src/hadoop/share/hadoop/yarn/lib/

启动Hive

启动Hadoop集群后才能启动Hive;如果Hadoop已经启动,请重启Hadoop后再启动Hive

[root@master conf]# start-all.sh

...... 

slave2: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-root-nodemanager-slave2.out

slave1: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-root-nodemanager-slave1.out

master: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-root-nodemanager-master.out

启动Hive

[root@master conf]# hive

Logging initialized using configuration in jar:file:/usr/local/src/hive/lib/hive-common-1.1.0.jar!/hive-log4j.properties

SLF4J: Class path contains multiple SLF4J bindings.

SLF4J: Found binding in [jar:file:/usr/local/src/hadoop/share/hadoop/common/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: Found binding in [jar:file:/usr/local/src/hive/lib/hive-jdbc-1.1.0-standalone.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]

hive>

至此——Hive数据仓库部署完成文章来源地址https://www.toymoban.com/news/detail-822884.html

到了这里,关于大数据平台环境搭建---- Hive&MySql数据库组件配置的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用sqoop将hive数据库导入至mysql

    前言:本文由实现此博客过程中遇到的问题及解决办法整理而成。博客:淘宝双11数据分析与预测课程案例-步骤三:将数据从Hive导入到MySQL_厦大数据库实验室 数据 数据放在 /usr/local/data/comment.csv 数据来源于:Amazon Reviews: Unlocked Mobile Phones | Kaggle 大数据开发环境 软件 版本 had

    2024年02月05日
    浏览(34)
  • 大数据之使用Spark全量抽取MySQL的数据到Hive数据库

    前言 一、读题分析 二、使用步骤 1.导入配置文件到pom.xml 2.代码部分 三、重难点分析 总结 本题来源于全国职业技能大赛之大数据技术赛项赛题-离线数据处理-数据抽取(其他暂不透露) 题目:编写Scala代码,使用Spark将MySQL的shtd_industry库中表EnvironmentData,ChangeRecord,BaseMach

    2024年02月11日
    浏览(37)
  • 大数据之使用Spark增量抽取MySQL的数据到Hive数据库(1)

    前言 题目: 一、读题分析 二、处理过程 1.采用SparkSQL使用max函数找到最大的日期然后转换成时间类型在变成字符串 2.这里提供除了SQL方法外的另一种过滤不满足条件的方法 三、重难点分析 总结  本题来源于全国职业技能大赛之大数据技术赛项 电商 赛题-离线数据处理-抽取

    2024年02月08日
    浏览(39)
  • 分布式数据库·Hive和MySQL的安装与配置

    一、版本要求:Hadoop:hadoop-2.10.1、MySQL:mysql-8.0.35、 HIVE :apache-hive-3.1.2、MySQL驱动:mysql-connector-java-5.1.49 安装包网盘链接:阿里云盘分享 安装位置  Hive:master、MySQL:slave1 二、卸载已安装的MySQL(如果不符合需求) 1.关闭MySQL服务 2.Yum检查 3.安装则直接删除 4.rpm检查 5.如果存在则删

    2024年02月03日
    浏览(47)
  • 大数据平台中元数据库—MySQL的异常故障解决

    本文的主要目标是解决大数据平台中元数据库MySQL的异常故障。通过分析应用响应缓慢的问题,找到了集群组件HIVE和元数据库MySQL的原因。通过日志分析、工具检测和专家指导等一系列方法, 最终确定问题的根源是大数据集群中租户的不规范使用所导致,并逐步解决了这个问

    2024年02月13日
    浏览(30)
  • 华为云云耀云服务器L实例评测|在Docker环境下部署Hive数据库

    ​ 这是 Maynor 创作的华为云云耀云服务器L实例测评的第四篇,华为云评测系列传送门: 华为云云耀云服务器L实例评测|单节点环境下部署ClickHouse21.1.9.41数据库 华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1 华为云云耀云服务器L实例评测|在Docker环境下部署

    2024年02月07日
    浏览(34)
  • C++ mySQL数据库连接池(windows平台)

    新手学了C++多线程,看了些资料练手写了C++数据库连接池小项目,自己的源码地址 MySQL数据库编程、单例模式、queue队列容器、C++11多线程编程、线程互斥、线程同步通信和 unique_lock、基于CAS的原子整形、智能指针shared_ptr、lambda表达式、生产者-消费者线程模型 为了提高MySQL数

    2024年03月09日
    浏览(40)
  • mysql 数据库主从复制搭建

    MySQL 主从复制主要用于实现高可用性和备份。在主从复制中,一个 MySQL 实例(称为主节点)将其数据更改复制到至少一个其他 MySQL 实例(称为从节点)上。主要借助于数据库二进制日志binlog进行数据的复制。 主从数据库对应的操作系统、数据库版本要一致。 1、主库配置 设

    2024年02月20日
    浏览(44)
  • MySQL:环境安装和数据库基础

    说明: • 安装与卸载中,用户全部切换成为root,⼀旦 安装,普通用户能使⽤的 • 初期练习,mysql不进行用户管理,全部使⽤root进行,尽快适应mysql语句,后⾯学了用户管 理,在考虑新建普通用户 查看安装信息: [root@VM-4-8-centos ~]# rpm -qa | grep mysql mysql-community-server-5.7.42-1

    2024年02月11日
    浏览(30)
  • linux环境安装mysql数据库

    一:查看是否自带mariadb数据库 命令:rpm -qa | grep mariadb 如果自带数据库则卸载掉重新安装 命令:yum remove mariadb-connector-c-3.1.11-2.el8_3.x86_64 二:下载mysql 命令:wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm 注意:如果出现No such file or directory,运行命令:su root 三

    2024年02月15日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包