HADOOP 伪分布式集群搭建

这篇具有很好参考价值的文章主要介绍了HADOOP 伪分布式集群搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一 linux 环境的搭建

由于笔者这里使用的是vmware 虚拟机 采用centos7 linux 操作系统进行搭建,所以一下示例均以centos7进行示例

1.  搭建vmware 虚拟机

(1)创建好虚拟机后采用linux ISO镜像文件启动安装centos7操作系统(其它方式也可以)

(2)完成之后设置网络模式,笔者采用桥接模式进行设置

         首先需要查看本机也就是宿主机的IP 地址以及网关,运行CMD命令进入DOS命令行窗口

         输入ipconfig 记下宿主机的默认网关HADOOP 伪分布式集群搭建

        打开vmware 网络适配器进行如下设置

     HADOOP 伪分布式集群搭建

   设置网卡IP地址以及DNS

vi /etc/sysconfig/network-scripts/ifcfg-ens33进行如下配置

HADOOP 伪分布式集群搭建

BOOTPROTO=static

ONBOOT=yes

IPADDR=你的IP地址

NETMASK=255.255.255.0

GETWAY=宿主机的网关地址

DNS1和DNS2

设置完成保存 进行重启网络服务

   HADOOP 伪分布式集群搭建 

重启之后可以使用IPADDR 查看配置是否生效

HADOOP 伪分布式集群搭建

设置主机名

首先查看主机名

HADOOP 伪分布式集群搭建

笔者这里已经设置过了,未设置 hostname 应该是localhost

设置主机名

HADOOP 伪分布式集群搭建

 设置完成之后进行检查查看

HADOOP 伪分布式集群搭建

设置hosts ip地址与主机名映射

vi /etc/hosts

HADOOP 伪分布式集群搭建

 关闭防火墙

HADOOP 伪分布式集群搭建

禁用防火墙服务

HADOOP 伪分布式集群搭建

关闭之后可以查看防火墙状态进行检查

HADOOP 伪分布式集群搭建

 进行selinux 安全设置

HADOOP 伪分布式集群搭建

 vi /etc/selinux/config 命令进行编辑 设置SELINUX=disabled

HADOOP 伪分布式集群搭建

 设置完成之后 输入命令reboot 进行重启,那么初始设置就设置好了

二 安装JDK 运行环境

由于Hadoop 依赖于JDK运行环境,笔者这里采用的是hadoop3.3.4版本,支持JDK11,所以笔者安装的也是JDK11 版本

1. 上传JDK 安装包至虚拟机后进行解压缩

HADOOP 伪分布式集群搭建

2. 进入解压缩后的JDK目录 pwd 进行复制安装目录

         HADOOP 伪分布式集群搭建

 3. 进行环境变量设置

HADOOP 伪分布式集群搭建

在文件末尾追加如下内容 后退出保存

HADOOP 伪分布式集群搭建

 source /etc/profile 使环境变量设置生效

HADOOP 伪分布式集群搭建

 4.使用java -version java javac 命令检查JDK 是否安装成功

HADOOP 伪分布式集群搭建

二 安装Hadoop 

 1. 上传好Hdoop 安装包之后进行解压缩

HADOOP 伪分布式集群搭建

 2. 进入hadoop 安装目录pwd 复制安装目录地址

HADOOP 伪分布式集群搭建

3. 设置环境变量

HADOOP 伪分布式集群搭建

打开之后追加如下内容

 HADOOP 伪分布式集群搭建

保存关闭后使用命令 source  /etc/profile 使环境变量配置生效

4. 进入/usr/local mkdir 创建目录hadoop (此目录用于存储namenode secondnamenode 快照文件)后面需要使用进行配置

至此为止hadoop 安装完成

三 配置hadoop 伪分布式集群

 1. 设置Hadoop 核心配置文件

进入Hadoop文件设置目录

HADOOP 伪分布式集群搭建

其中有如下文件需要进行配置 

1. core-site.xml

HADOOP 伪分布式集群搭建

(这里的属性hadoop.tmp.dir 就是你的hadoop namenode 快照存储位置)

2. mapred-site.xml

 HADOOP 伪分布式集群搭建

3. hdfs-site.xml

HADOOP 伪分布式集群搭建

HDFS 会以128M为单位将上传的文件进行切分为若干个block 存储在不同的datanode中,由于为了在不可靠的机器上进行提供可靠的服务,所以采用多副本机制进行存储。 HDFS 副本数如果不进行设置则默认为3 

(这里笔者关闭了hdfs的权限认证)

  4.yarn-site.xml

HADOOP 伪分布式集群搭建

5. hadoop-env.sh (运行环境配置)

HADOOP 伪分布式集群搭建

添加安装好的JDK目录 进入hadoop 运行环境配置

6. 添加主机名至works 文件

HADOOP 伪分布式集群搭建

HADOOP 伪分布式集群搭建

2. 添加用户配置信息

1. 进入hadoop sbin目录

HADOOP 伪分布式集群搭建

2. 编辑如下内容进入以下文件

(1) start-all.sh (2) stop-all.sh (3)start-dfs.sh (4) stop-dfs.sh (5) start-yarn.sh (6) stop-yarn.sh  

在这里以start-all.sh 为例:

HADOOP 伪分布式集群搭建

3. 初始化HDFS 文件系统 

如果是第一次安装使用Hadoop那么在启动之前需要出示话HDFS文件系统

HADOOP 伪分布式集群搭建

 看到如下信息则初始化完成

HADOOP 伪分布式集群搭建

 4. 设置SSH免密登录

由于Hdoop namenode 与datanode 内部通讯协议采用RPC协议,则需要进行设置SSH免密登录

这里笔者采用RSA 对称加密算法

1. 创建密钥

HADOOP 伪分布式集群搭建

2. 添加密钥进本机

 HADOOP 伪分布式集群搭建

 4. 启动hadoop

HADOOP 伪分布式集群搭建

 使用JPS 查看是否启动成功

HADOOP 伪分布式集群搭建

至此为止hadoop 伪分布式集群搭建完成

由于笔者是第一次进行编写,如有什么地方写的有遗漏欢迎指出进行更新改进

谢谢! 文章来源地址https://www.toymoban.com/news/detail-428001.html

到了这里,关于HADOOP 伪分布式集群搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux从零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

    和相关配置版本 :Linux CentOS Hadoop Java 版本: CentOS7 Hadoop3.2.0 JDK1.8 虚拟机参数信息内存3.2G、处理器2x2、内存50G ISO:CentOS-7-x86_64-DVD-2009.iso 基本主从思路: 先把基础的设置(SSH、JDK、Hadooop、环境变量、Hadoop和MapReduce配置信息)在一台虚拟机(master)上配好,通过

    2024年02月05日
    浏览(65)
  • Hadoop分布式集群搭建

    集群以三台电脑搭建,每台电脑创建一个UbuntuKylin虚拟机,集群以三台UbuntuKylin虚拟机为基础搭建,虚拟机主机名分别为hadoop101、hadoop111和hadoop121。IP地址分别为192.168.214.101、192.168.214.111和192.168.214.121。 主机名 IP地址: hadoop101 192.168.214.101 hadoop111 192.168.214.111 hadoop121 192.168.214

    2024年02月03日
    浏览(48)
  • HadoopHA模式(由于Hadoop的HA模式是在Hadoop完全分布式基础上,利用zookeeper等协调工具配置的高可用的Hadoop集群模式)

    目录 1.前期准备 1.1.hadoop-3.1.3.tar.gz,jdk-8u212-linux-x64.tar.gz,apache-zookeeper-3.5.7-bin.tar.gz三个包提取码:k5y6 2.解压安装包,配置环境变量 3. 将三个节点分别命名为master、slave1、slave2并做免密登录 免密在前面Hadoop完全分布式搭建说过,这里不再赘述 4.搭建zookeeper集群  根据配置的

    2024年02月04日
    浏览(40)
  • Hadoop完全分布式集群搭建

    1.在虚拟机关机的状态下选择克隆 2.开始克隆 3.选择从当前状态创建 4.创建一个完整的克隆 5.选择新的虚拟机存储位置(选择内存充足的磁盘) 6.开始克隆 7.克隆完成 8.同样的方法克隆第二台虚拟机 9.在计算机中存在三台虚拟机 将第一台虚拟机更名为hadoop01 修改hadoop01的主机

    2024年02月02日
    浏览(45)
  • Hadoop 完全分布式集群搭建

    部署前可以先了解下 Hadoop运行模式及目录结构-CSDN博客 服务 hadoop102 hadoop103 hadoop104 NameNode √ DataNode √ √ √ Secondary NameNode √ ResourceManager √ NodeManager √ √ √ JobHistoryServer √ IPv4 192.168.88.102 192.168.88.103 192.168.88.104 NodeObject master worker1 worker2 最小化安装 Neokylin7.0 用于搭建 Had

    2024年02月04日
    浏览(55)
  • Hadoop分布式集群搭建教程

    大数据课程需要搭建Hadoop分布式集群,在这里记录一下搭建过程 搭建Haoop分布式集群所需环境: VMware:VMware-workstation-full-17.0.2-21581411 CentOS:CentOS-7-x86_64-DVD-2003, Hadoop:hadoop-3.1.3.tar JDK:jdk-8u212-linux-x64.tar.gz 新建虚拟机 设置用户 命名虚拟机 自定义硬件,完成虚拟机创建 开始

    2024年02月08日
    浏览(38)
  • HADOOP 伪分布式集群搭建

    由于笔者这里使用的是vmware 虚拟机 采用centos7 linux 操作系统进行搭建,所以一下示例均以centos7进行示例 1.  搭建vmware 虚拟机 (1)创建好虚拟机后采用linux ISO镜像文件启动安装centos7操作系统 (其 它方式也可以) (2)完成之后设置网络模式,笔者采用桥接模式进行设置  

    2024年02月01日
    浏览(37)
  • 【Hadoop】完全分布式集群搭建

    大家好,我是向阳花花花花,这篇文章是我历时三天,推翻重做两小时进行搭建的Hadoop集群(完全分布式)个人笔记和感想,收录于初心的《大数据》专栏。 🏠 个人主页:初心%个人主页 🧑 个人简介:大家好,我是初心,一名正在努力的双非二本院校计算机专业学生 💕

    2024年02月15日
    浏览(40)
  • hadoop完全分布式集群搭建(超详细)-大数据集群搭建

    本次搭建完全分布式集群用到的环境有: jdk1.8.0 hadoop-2.7.7 本次搭建集群所需环境也给大家准备了,下载链接地址:https://share.weiyun.com/dk7WgaVk 密码:553ubk 本次完全分布式集群搭建需要提前建立好三台虚拟机,我分别把它们的主机名命名为:master,slave1,slave2 一.配置免密登陆 首先

    2024年02月10日
    浏览(48)
  • Hadoop分布式集群搭建(三台虚拟机)

    搭建好VMware Workstation Pro(我这里装的版本是16) 搭建hadoop集群需要三台虚拟机 1.新建虚拟机——自定义(高级)  2.不用改动,点击下一步  3.映像文件稍后再加入  4.选择Linux——CentOS 7 64位  5.可以在存放虚拟机的文件内新建一个文件夹,专门放hadoop集群需要的虚拟机(有三

    2024年02月08日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包