VM VirtualBox 实现 Hadoop 3.3.4集群搭建

这篇具有很好参考价值的文章主要介绍了VM VirtualBox 实现 Hadoop 3.3.4集群搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Hadoop集群搭建

环境准备

虚拟机:Oracle VM VirtualBox
操作系统: Centos8
Hadoop版本:3.3.4
JDK版本:1.8
免密登录(SSH协议):MobaXterm

安装虚拟机

  1. 打开Oracle VM VirtualBox并新建虚拟机

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 内存选择
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  2. 选择现在创建虚拟硬盘
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  3. 设置虚拟硬盘文件类型
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  4. 建议动态分配
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  5. 设置虚拟硬盘大小
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    注意:创建完先不要打开,先进行环境配置

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 设置存储
    选择虚拟盘Centos8,用于启动
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  2. 设置网络
    这里要设置双网卡,后面才能与主机与外网进行连接
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  3. 启动创建的虚拟机VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    注:虚拟机鼠标到桌面是右Ctrl

  4. 选择语言VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  5. 设置时间

VM VirtualBox 实现 Hadoop 3.3.4集群搭建VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 设置网络
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    将网卡打开即可,后面还可更改

  2. 设置root账户
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    可创建新用户也可以不创建,但注意区分密码

  3. 开始安装
    到此,虚拟机创建完成

Linux系统网络配置

  1. 图形界面与字符界面
    图形界面到字符界面:Ctrl+Alt+F2/F3
    字符界面到图形界面:Ctrl+Alt+F1
  2. root权限登录
  3. 主机名
    查看主机名
    hostname

修改主机名,这里改成名字缩写加序号,便于管理

    hostnamectl set-hostname 主机名
  1. 配置IP映射
    vi /etc/hosts

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

保存并退出,底行命令下wq

  1. 配置网络参数
    vi /etc/sysconfig/network-scripts/ifcfg-enpOs8

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

重启虚拟机

    reboot
  • ONBOOT=yes:表示启动这块网卡
  • BOOTPROTO=static:表示静态路由协议,保持IP固定
  • IPADDR:虚拟机IP地址,与前面映射一致
  • GATEWAY:虚拟机网关,一般是将IP地址最后一位数变成 2
  • NETMASK:虚拟机掩码,配置为 255.255.255.0 即可

另一块网卡(ifcfg-enpOs3)保持打开即可

  1. 配置效果验证
    Linux下查看网卡信息
    ifconfig

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
enpOs8下出现自己配置的静态IP,说明配置成功
再执行

    ping www.baidu.com

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
有数据传输说明网络正常,Ctrl+c退出当前命令。
window系统下打开cmd窗口执行如下命令,地址为设置的虚拟机地址。

    ping 192.168.56.201

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
有数据传输说明主机与虚拟机建立联系。
到此虚拟机网络配置完成!

虚拟机克隆

  1. 右击虚拟机 01,点击复制
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
  2. 按如上步骤设置主机名与IP地址
    注意:与之前设置的 IP 映射一致
  3. 同理,复制好 03 虚拟机后进行同样的配置

SSH 服务配置

  1. 打开 MobaXterm 远程连接工具,点击导航栏上的"Session",然后单击"SSH"
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    点击 OK,设置好 MobaXterm 的密码后,输入 root 用户密码后即可实现远程登录。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    到此,虚拟机远程密码登录实现!
    虚拟机在 Oracle VM VirtualBox 即可在 MobaXterm 实现对单台虚拟机的操作。
    同理:对 02,03 虚拟机实现 SSH 免密登录
  2. 删除虚拟机的~/.ssh 目录。
    [root@hsq01 ~]# rm -rf .ssh
    [root@hsq02 ~]# rm -rf .ssh
    [root@hsq03 ~]# rm -rf .ssh
  1. 在 01 虚拟机上新建 SSH 公私密钥对。
    [root@hsq01 ~]# ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  1. 实现在 01 虚拟机上免密登录 02,03 虚拟机
    [root@hsq01 ~]# ssh-copy-id root@hsq01
    [root@hsq01 ~]# ssh-copy-id root@hsq02
    [root@hsq01 ~]# ssh-copy-id root@hsq03

提示:出现(yes/no)?,输入yes,Enter 即可。

  1. 验证 SSH 免密登录是否配置成功
    [root@hsq01]# ssh hsq02

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
如此表示登录成功!
输入exit,Enter 即可退回 01 虚拟机。

Hadoop 集群搭建

提示:Window 下安装好的安装包直接通过 MobaXterm 拖入即可

安装JDK

  1. 将 JDK8 安装包放到如下目录。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
  2. 安装 JDK。
    [root@hsq01 ~]# tar -zxvf (安装包name)jdk-8u341-linux-x64.tar.gz -C /usr/local/
  1. 配置 JDK 系统环境变量
    [root@hsq01 ~]# vi /etc/profile

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 使配置文件生效
    [root@hsq01 ~]# source /etc/profile
  1. JDK 环境验证
    java -version

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
到此JDK安装和配置成功。

安装 Hadoop

  1. 将 Hadoop 安装包 放到如下目录。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
  2. 安装 Hadoop。
    [root@hsq01 ~]# tar -zxvf (安装包name)/root/hadoop-3.3.4.gz -C /usr/local/
  1. 配置 Hadoop 环境变量
    [root@hsq01 ~]# vi /etc/profile

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 使配置文件生效
    [root@hsq01 ~]# source /etc/profile
  1. 验证
    [root@hsq01 ~]# hadoop -version

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

Hadoop 集群配置

  1. 修改 hadoop-env.sh 文件
    [root@hsq01 ~]# cd $HADOOP_HOME
    [root@hsq01 hadoop-3.3.4]# cd etc/hadoop
    [root@hsq01 hadoop]# vi hadoop-env.sh

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 配置 core-site.xml 文件
    [root@hsq01 hadoop]# vi core-site.xml

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 配置 hdfs-site.xml
    [root@hsq01 hadoop]# vi hdfs-site.xml

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 配置 mapred-site.xml 文件
    [root@hsq01 hadoop]# vi mapred-site.xml

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 配置 yarn-site.xml 文件
    [root@hsq01 hadoop]# vi yarn-site.xml

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 设置从节点,也就是修改 workers 文件
    [root@hsq01 hadoop]# vi workers

VM VirtualBox 实现 Hadoop 3.3.4集群搭建
注意:Hadoop2.版本是执行 vi slaves

  1. 将主节点的配置分发到其他节点
    [root@hsq01 ~]# scp /etc/profile hsq02:/etc/profile
    [root@hsq01 ~]# scp /etc/profile hsq03:/etc/profile
    [root@hsq01 ~]# scp -r /usr/local/hadoop-3.3.4 hsq02:/usr/local/
    [root@hsq01 ~]# scp -r /usr/local/hadoop-3.3.4 hsq03:/usr/local/
    [root@hsq01 ~]# scp -r /usr/local/jdk1.8.0_341 hsq02:/usr/local/
    [root@hsq01 ~]# scp -r /usr/local/jdk1.8.0_341 hsq03:/usr/local/

执行完上述命令后,还需要再 02,03 虚拟机上分别执行 source /etc/profile 指令刷新配置文件。到处,整个集群所有节点都有了 Hadoop 运行所需要的环境和文件,Hadoop 集群安装配置完成。

Hadoop 集群测试

格式化文件系统

    [root@hsq01 ~]# hdfs namenode -format

或者

    [root@hsq01 ~]# hadoop namenode -format

VM VirtualBox 实现 Hadoop 3.3.4集群搭建注意:

  • 格式化只需要在 Hadoop 初次启动前执行一次即可;
  • 出现 has been successfully formatted 表明文件系统成功格式化;
  • 否则,指令错误或者前面配置错误。

启动和查看 Hadoop 进程

  1. 虚拟机01(主节点虚拟机),启动 Hadoop 进程
    [root@hsq01 ~]# start-dfs.sh
    [root@hsq01 ~]# start-yarn.sh

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 查看 Hadoop 进程
    ① 在 01 虚拟机中查看。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    ② 在 02 虚拟机中查看
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    ③ 在 03 虚拟机中查看
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    此时,看到规划的 Hadoop 均已启动,则 Hadoop 全分布式搭建成功。

查看Web界面

  1. 先配置 window 下的 hosts 文件
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    用VS Code 打开,用管理员身份保存修改即可。
  2. 关闭虚拟机防火墙
    systemctl stop firewalld.service
    systemctl disable firewalld.service

三台虚拟机都执行。

  1. window 下浏览器访问 http://hsq01:9870 和 http://hsq01:8088
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    到此,Hadoop 集群的 HDFS UI 界面和 YARN UI 界面通过 Web 界面均可访问,并且显示正常,便于通过 Web 界面对集群状态进行管理和查看。

简单使用 Hadoop 集群

  1. 在集群主节点 01 上的/root/目录下,使用vi test.txt新建一个 test.txt 文本文件,并编写内容。
    这是我的测试文件
  1. 上传 test.txt 到 HDFS 的 / 目录下。
    [root@hsq01 ~]# hdfs dfs -put test.txt /
  1. 查看上传的文件。
    [root@hsq01 ~]# hdfs dfs -cat /test.txt

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

  1. 通过 Web 界面下载文件,用记事本查看即可。
    刚刚的 Web 界面刷新。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    点击文件下载。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    打开。
    VM VirtualBox 实现 Hadoop 3.3.4集群搭建
    内容一致,表明 Hadoop 搭建成功!!!

补充:不知道你们是否也喜欢新版本,之前使用 JDK 19 也成功搭建 Hadoop 集群,但 Web 界面无法下载上传的文件,没有解决,查阅资料说是使用的 JDK 版本过新(只是 Web 界面那有问题,没有找到合适方法解决),所以建议使用稳定的 JDK 版本(😔,越新真不一定好用),新版本的 Hadoop 暂时没有遇到问题。文章来源地址https://www.toymoban.com/news/detail-407078.html

到了这里,关于VM VirtualBox 实现 Hadoop 3.3.4集群搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop集群搭建--集群启动

    关注微信公共号:小程在线 [atguigu@hadoop102 hadoop]$ vim /opt/module/hadoop-3.1.3/etc/hadoop/workers 增加以下内容: hadoop102 hadoop103 hadoop104 [atguigu@hadoop102 hadoop]$ xsync /opt/module/hadoop-3.1.3/etc 2.1 第一启动,需要在hadoop102节点格式化NameNode。 [atguigu@hadoop102 hadoop-3.1.3]$ hdfs namenode -format 2.2 启动 H

    2024年02月09日
    浏览(39)
  • 在Oracle VM VirtualBox中添加磁盘,并挂载磁盘

    一、打开虚拟机分配硬盘空间          这里别选错了,是SATA,要不然就可能把虚拟机送走了                 选择新加的磁盘空间             然后就会发现多了一个 二、在linux系统中格式化磁盘         如果是分配过的磁盘会有黄框内的分区信息,我们需要对/de

    2024年02月06日
    浏览(33)
  • Oracle VM VirtualBox安装的Centos7无法上网

    Oracle VM VirtualBox安装的Centos7无法上网解决方法: 1、设置第一块网卡使用 仅主机网络。 2、设置第二块网卡使用 网络地址转换 (NAT)。  

    2024年02月03日
    浏览(44)
  • Hadoop集群搭建(hadoop-3.3.5)

    1、配置环境变量 2、修改host映射 1、core-site.xml 2、hdfs-site.xml 3、hadoop-env.sh 4、works 1、格式化集群 2、启动集群 3、进程查看 4、浏览器查看

    2024年02月11日
    浏览(25)
  • Hadoop入门详解以及Hadoop集群搭建

    hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。hadoop充分利用了集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System),

    2024年02月04日
    浏览(37)
  • hadoop集群搭建、spark集群搭建、pyspark搭建(linux+window)

    本文记录学习过程中Hadoop、zookeeper、spark集群搭建,主要为pyspark库服务(具体为window上pyspark环境和pyspark库,linux上spark框架、pyspark应用程序、pyspark环境和pyspark库)。pyspark环境是用anaconda3搭建的环境。pyspark应用程序,是安装spark集群里面自带的,提供一个python解释器环境来执

    2024年01月22日
    浏览(38)
  • 搭建hadoop集群,从安装虚拟机开始直到hadoop成功搭建

    搭建Hadoop集群   一、实验目的与要求 学习和掌握Hadoop的相关应用,首先必须得学会搭建Hadoop集群。本次实验将针对Hadoop集群的搭建内容进行演练。学会虚拟机的安装和克隆,Linux系统的网络配置和SSH配置,Hadoop集群的搭建和配置,Hadoop集群测试,熟悉Hadoop集群基本的操作。

    2023年04月08日
    浏览(33)
  • Oracle VM VirtualBox虚拟机配置(配置Windows7为例)

    为了学习DX11故配置了一套虚拟机的环境,将其中细则记录一番。 Win7(32位)+VS2013 的配置,主要原因是和学校机房一样比较方便问老师,试过VS2010的古早界面不太舒服,当然安装2010~2013都可以正常跑代码,就是需要搭环境 目录 一:下载Oracle VM VirtualBox,下载地址(速度都差

    2024年02月06日
    浏览(44)
  • hadoop完全分布式集群搭建(超详细)-大数据集群搭建

    本次搭建完全分布式集群用到的环境有: jdk1.8.0 hadoop-2.7.7 本次搭建集群所需环境也给大家准备了,下载链接地址:https://share.weiyun.com/dk7WgaVk 密码:553ubk 本次完全分布式集群搭建需要提前建立好三台虚拟机,我分别把它们的主机名命名为:master,slave1,slave2 一.配置免密登陆 首先

    2024年02月10日
    浏览(38)
  • Hadoop运行集群搭建

    IP地址 192.168.10.100 、主机名称 hadoop100, 内存 4G 、硬盘 50G 测试下虚拟机联网情况   安装 epel-release 注: Extra Packages for Enterprise Linux 是为“红帽系”的操作系统提供额外的软件包 , 适用于 RHEL、CentOS 和 Scientific Linux。相当于是一个软件仓库,大多数 rpm 包在官方 repository 中是找

    2024年02月02日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包