Hadoop分布式安装部署

这篇具有很好参考价值的文章主要介绍了Hadoop分布式安装部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Hadoop分布式安装部署软件

VMware Workstation Pro17

CentOS7

Hadoop-3.3.6

jdk1.8.0_391

第一步：创建虚拟机

修改网络配置

事先需要在本地电脑安装VMware，再创建虚拟机，并且克隆该虚拟机，使用多台机器配合完成完全的分布式文件系统。本文使用三台虚拟机搭建Hadoop。

Hadoop在安装部署之前，需要对虚拟机进行网络配置，将虚拟机的网络状态由动态修改为动态，通过对/etc/sysconfig/network-scripts/ifcfg-ens33修改再支持systemctl restart network.service重新启动网络即可生效。

Hadoop分布式安装部署,分布式,hadoop,大数据

其余两台机器也需要将网络同步修改为静态网络。

主机名与IP映射

修改主机名在/etc/hostname中修改，再重启系统即可修改成功

主机名与IP映射需要在/etc/hosts中添加

Hadoop分布式安装部署,分布式,hadoop,大数据

可使用ping命令测试是否能够连接，三台虚拟机均需进行此项操作。

第二步：安装JDK和Hadoop

安装JDK

创建linux系统时默认自带安装了openjdk，需要先将openjdk卸载后再重新安装jdk。
使用rpm -qa | grep jdk查询openjdk的安装包，再使用rpm -e --nodeps + 安装包将其卸载。
使用tar -zvxf + jdk压缩包路径将其解压
在/etc/profile修改环境变量，再使用source /etc/profile使其生效

export JAVA_HOME=/usr/java/jdk1.8.0_391
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

安装Hadoop环境

同样先将hadoop压缩包解压，在/etc/profile添加环境变量，再source /etc/profile。

export HADOOP_HOME=/usr/local/hadoop-3.3.6
export HADOOP_PREFIX=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

修改Hadoop相关配置文件，具体文件配置详情：Hadoop安装部署之修改配置文件

第三步：ssh免密登录

防火墙关闭（三台机器）

关闭防火墙：systemctl stop firewalld.service
禁止防火墙自启动：systemctl disable firewalld.service
查看防火墙状态：systemctl status firewalld.service

ssh免密登录

主机器终端执行：ssh-keygen #需要多次回车生成公钥、私钥
将其复制到这三台机器中：ssh-copy-id 主机名
使用ssh 主机名免密登录，exit命令即可推出

第四步：Hadoop初始化

将主机器的hadoop文件使用scp命令复制到其余两台机器，因hadoop文件太大了，故本文三台机器的hadoop事先已先解压，只需要将hadoop配置文件复制过去即可

Hadoop分布式安装部署,分布式,hadoop,大数据

若是将整个hadoop文件都拷贝到别的机器，执行scp -r hadoop安装目录路径 root@主机名:$PWD

可通过执行hadoop命令检验hadoop是否安装部署成功

Hadoop分布式安装部署,分布式,hadoop,大数据

hadoop集群启动之前，需要进行format初始化操作，但初始化操作只需要一次即可！！！

多次初始化会造成数据丢失，也会造成hdfs集群主从角色互不识别，需要通过删除所有机器hadoop.tmp.dir目录（core-site.xml中设置该目录）重新进行format初始化！！！

执行hdfs namenode -format命令出现如下信息即可初始化成功

Hadoop分布式安装部署,分布式,hadoop,大数据

第五步：Hadoop集群启动

在配置好机器之间的ssh免密登录和workers文件的前提下，可在主机器上使用终端启动Hadoop集群

HDFS集群：start-dfs.sh #开启hdfs集群

stop-dfs.sh #关闭hdfs集群

YARN集群：start-yarn.sh #开启YARN集群

stop-yarn.sh #关闭YARN集群

Hadoop集群：start-all.sh #开启Hadoop集群

stop-all.sh #关闭Hadoop集群文章来源地址https://www.toymoban.com/news/detail-819172.html

到了这里，关于Hadoop分布式安装部署的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

Hadoop分布式安装部署