Hadoop分布式安装部署

这篇具有很好参考价值的文章主要介绍了Hadoop分布式安装部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Hadoop分布式安装部署软件

VMware Workstation Pro17

CentOS7

Hadoop-3.3.6

jdk1.8.0_391

第一步:创建虚拟机

修改网络配置

事先需要在本地电脑安装VMware,再创建虚拟机,并且克隆该虚拟机,使用多台机器配合完成完全的分布式文件系统。本文使用三台虚拟机搭建Hadoop。

Hadoop在安装部署之前,需要对虚拟机进行网络配置,将虚拟机的网络状态由动态修改为动态,通过对/etc/sysconfig/network-scripts/ifcfg-ens33修改再支持systemctl restart network.service重新启动网络即可生效。

Hadoop分布式安装部署,分布式,hadoop,大数据

其余两台机器也需要将网络同步修改为静态网络。

主机名与IP映射

修改主机名在/etc/hostname中修改,再重启系统即可修改成功

主机名与IP映射需要在/etc/hosts中添加

Hadoop分布式安装部署,分布式,hadoop,大数据

可使用ping命令测试是否能够连接,三台虚拟机均需进行此项操作。

第二步:安装JDK和Hadoop

安装JDK

  1. 创建linux系统时默认自带安装了openjdk,需要先将openjdk卸载后再重新安装jdk。
  2. 使用rpm -qa | grep jdk查询openjdk的安装包,再使用rpm -e --nodeps + 安装包将其卸载。
  3. 使用tar -zvxf + jdk压缩包路径将其解压
  4. /etc/profile修改环境变量,再使用source /etc/profile使其生效
export JAVA_HOME=/usr/java/jdk1.8.0_391
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

安装Hadoop环境

同样先将hadoop压缩包解压,在/etc/profile添加环境变量,再source /etc/profile。

export HADOOP_HOME=/usr/local/hadoop-3.3.6
export HADOOP_PREFIX=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

 修改Hadoop相关配置文件,具体文件配置详情:Hadoop安装部署之修改配置文件

第三步:ssh免密登录

防火墙关闭(三台机器)

  1. 关闭防火墙:systemctl stop firewalld.service
  2. 禁止防火墙自启动:systemctl disable firewalld.service
  3. 查看防火墙状态:systemctl status firewalld.service

ssh免密登录

  1. 主机器终端执行:ssh-keygen #需要多次回车生成公钥、私钥
  2. 将其复制到这三台机器中:ssh-copy-id 主机名
  3. 使用ssh 主机名免密登录,exit命令即可推出

第四步:Hadoop初始化

将主机器的hadoop文件使用scp命令复制到其余两台机器,因hadoop文件太大了,故本文三台机器的hadoop事先已先解压,只需要将hadoop配置文件复制过去即可

Hadoop分布式安装部署,分布式,hadoop,大数据

若是将整个hadoop文件都拷贝到别的机器,执行scp -r hadoop安装目录路径 root@主机名:$PWD

可通过执行hadoop命令检验hadoop是否安装部署成功

Hadoop分布式安装部署,分布式,hadoop,大数据

hadoop集群启动之前,需要进行format初始化操作,但初始化操作只需要一次即可!!!

多次初始化会造成数据丢失,也会造成hdfs集群主从角色互不识别,需要通过删除所有机器hadoop.tmp.dir目录(core-site.xml中设置该目录)重新进行format初始化!!!

 执行hdfs namenode -format命令出现如下信息即可初始化成功

Hadoop分布式安装部署,分布式,hadoop,大数据

第五步:Hadoop集群启动

在配置好机器之间的ssh免密登录和workers文件的前提下,可在主机器上使用终端启动Hadoop集群

HDFS集群:start-dfs.sh        #开启hdfs集群

                     stop-dfs.sh        #关闭hdfs集群

YARN集群:start-yarn.sh        #开启YARN集群

                     stop-yarn.sh        #关闭YARN集群

Hadoop集群:start-all.sh        #开启Hadoop集群

                        stop-all.sh        #关闭Hadoop集群文章来源地址https://www.toymoban.com/news/detail-819172.html

到了这里,关于Hadoop分布式安装部署的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据学习02-Hadoop分布式集群部署

    操作系统:centos7 软件环境:jdk8、hadoop-2.8.5 1.下载VMware,建议支持正版 2.安装到Widows目录下任意位置即可,安装目录自定义。打开VMware,界面如下: 3.创建虚拟机 创建虚拟机—选择自定义 这一步按照默认的配置就好 选择系统,安装程序光盘映像文件iso,这里需要下载cenos镜像

    2024年02月16日
    浏览(63)
  • 部署HDFS集群(完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包)

    目录 前置 一、上传解压 (一 )上传 (二)解压 二、修改配置文件 (一)配置workers文件 (二)配置hadoop-env.sh文件 (三)配置core-site.xml文件 (四)配置hdfs-site.xml文件 三、分发到hp2、hp3, 并设置环境变量 (一)准备数据目录    (二)配置环境变量 四、创建数据目录,并

    2024年04月14日
    浏览(58)
  • 大数据技术栈-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超详细-小白注释版)虚拟机安装+平台部署

    目录 环境条件: 1、安装虚拟机(已安装好虚拟机的可跳转至  二、安装JDK与Hadoop) (1)直接新建一台虚拟机 (2)首次启用虚拟机,进行安装 一、集群前置环境搭建(三台机器分别设置hostname、网卡(ip)配置、ssh免密登录) 1、查看一下本机与虚拟机的网卡和ip信息 (1)

    2024年02月06日
    浏览(49)
  • Hadoop3.3.5最新版本安装分布式集群部署

    Index of /dist/hadoop/common https://archive.apache.org/dist/hadoop/common  集群规划: 注意: NameNode和SecondaryNameNode不要安装在同一台服务器 ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台机器上。 机器 ip 分配节点 node01 192.168.56.201 NameNode 、DataNode、NodeManager node02 192.

    2024年02月01日
    浏览(70)
  • (大数据开发随笔9)Hadoop 3.3.x分布式环境部署——全分布式模式

    分布式文件系统中,HDFS相关的守护进程也分布在不同的机器上,如: NameNode守护进程,尽可能单独部署在一台硬件性能较好的机器中 其他的每台机器上都会部署一个DataNode进程,一般的硬件环境即可 SecondaryNameNode守护进程最好不要和NameNode在同一台机器上 守护进程布局 Name

    2023年04月16日
    浏览(60)
  • 《Hadoop大数据技术》实验报告(1)Hadoop的伪分布式安装和配置

    《Hadoop大数据技术》实验报告(1) 班级 学号 姓名 Hadoop的伪分布式安装和配置 一、实验目的 1、理解Hadoop伪分布式的安装过程; 2、学会JDK的安装和SSH免密码配置; 3、学会Hadoop的伪分布式安装和配置。 二、实验内容 在linux平台中安装Hadoop,包括JDK安装、SSH免密码配置和伪分

    2023年04月23日
    浏览(67)
  • 大数据 | 实验零:安装 Hadoop 伪分布式系统

    👀 前言 :本篇是个人配置环境的总结,基于指导书,补充了许多在配置过程中出现的问题的解决细节。希望能帮到你😄。 Vmware workstation pro 16 Ubuntu 20.04 JDK 1.8 Hadoop 3.2.2 下边资源是本篇博客会用到的相关文件 (建议直接下载,相关代码直接对应的下述文件, 下载完先不要动

    2023年04月17日
    浏览(49)
  • Hadoop 完全分布式部署

    前期准备 分析: 准备3台客户机(关闭防火墙、静态IP、主机名称) 【CentOS 7】 安装JDK 【jdk1.8】 安装Hadoop 【hadoop 3.3.4】 配置环境变量 配置ssh 配置集群 单点启动 群起并测试集群 Hadoop 集群规划: node1 node2 node3 IP 10.90.100.121 10.90.100.122 10.90.100.123 HDFS NameNode 、 DataNode DataNode D

    2024年03月23日
    浏览(48)
  • 在macOS上安装Hadoop: 从零到分布式大数据处理

    要在 macOS 上安装 Hadoop,您可以按照以下步骤进行操作: 前往Hadoop的官方网站下载最新版本的Hadoop。选择一个稳定的发行版本并下载压缩文件(通常是.tar.gz格式)。 将下载的 Hadoop 压缩文件解压缩到您选择的目录中。可以使用终端执行以下命令: 请将 hadoop-version 替换为您下

    2024年02月06日
    浏览(57)
  • Hadoop集群部署-(完全分布式模式,hadoop-2.7.4)

    相关软件下载准备:(推荐) 虚拟机运行环境:VMware 16.1.1 映像文件:CentOS-7-x86_64-DVD-1810.iso 远程登录工具:Xshell-7.0.0090.exe Xftp传输工具:Xftp-7.0.0111p.exe 首先掌握VMware的下载与安装,有linux学习基础的同学可以略看。 参考链接:https://mp.weixin.qq.com/s/CUiauodcjCFPIXEFEx8fOw 【软件名

    2024年02月09日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包