大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

这篇具有很好参考价值的文章主要介绍了大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

**相关资源:**https://musetransfer.com/s/q43oznf6f(有效期至2023年3月16日)|【Muse】你有一份文件待查收,请点击链接获取文件

1.检查是否安装ssh (CentOS 7 即使是最小化安装也已附带openssh 可跳过本步骤)

  rpm -qa | grep ssh

若已安装进行下一步骤 若未安装 请自行百度 本教程不做过多讲解

2.配置ssh,实现无密码登录

1.开启sshd服务

  systemctl start sshd.service

2.进入 ~/.ssh 文件夹

  cd ~/.ssh

若不存在该文件夹 可使用以下命令 使用root账户登录后生成

  ssh root@localhost

然后输入yes 并输入本机root密码

3.进入 .ssh目录后 执行

  ssh-keygen -t rsa 

一路按回车就可以

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

4.做ssh免密认证 执行以下命令即可

  cat id_rsa.pub >> authorized_keys

5.修改文件权限

  chmod 644 authorized_keys

6.检测是否可以免密登录

  ssh root@localhost

无需输入密码登录 即为成功

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

3上传jdk,并配置环境变量

将文件上传至CentOS7 的 /usr/local/java 文件夹中

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

进入文件夹并进行解压缩

tar -zxvf jdk-8u212-linux-x64.tar.gz

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

将压缩包删除

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

新建/etc/profile.d/my_env.sh 文件

vim /etc/profile.d/my_env.sh

添加如下内容:

#JAVA_HOME
export JAVA_HOME=/usr/local/java/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

保存后退出 :wq!

source 一下/etc/profile 文件,让新的环境变量 PATH 生效

source /etc/profile

测试 JDK 是否安装成功

java -version

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

4上传Hadoop,并配置环境变量

将文件上传至CentOS7 的 /usr/local/hadoop 文件夹中

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

进入文件夹并进行解压缩

tar -zxvf hadoop-3.1.3.tar.gz

将压缩包删除

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

将 Hadoop 添加到环境变量

vim /etc/profile.d/my_env.sh

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

保存后退出 :wq!

source 一下/etc/profile 文件,让新的环境变量 PATH 生效

source /etc/profile

测试 hadoop 是否安装成功

hadoop version

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

5 hadoop准备工作

创建hadoop存放数据的目录

cd 到hadoop目录下。执行以下命令

mkdir temp

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

创建namenode 存放 name table 的目录

cd 到 temp目录下创建dfs目录,再dfs目录下创建name目录

cd temp/
mkdir dfs 
ls
cd dfs/
mkdir name
ls

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

创建 datanode 存放 数据 block 的目录

dfs目录下创建data目录

mkdir data
ls

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

修改/usr/local/hadoop/hadoop-3.1.3/etc/hadoop文件夹下的core-site.xml配置文件

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

默认情况下,Hadoop将数据保存在/tmp下,当重启系统时,/tmp中的内容将被自动清空,所以我们需要制定自己的一个Hadoop的目录,用来存放数据。另外需要配置Hadoop所使用的默认文件系统,以及Namenode进程所在的主机

vim core-site.xml

打开 core-site.xml 文件后,将其中的

<configuration>
</configuration>

修改为以下的配置:

<configuration>
<property>
    <!-- 指定hadoop运行时产生文件的存储路径-->
    <name>hadoop.tmp.dir</name>
    <value>/opt/module/temp</value>
    <description>A base for other temporary directories.</description>
</property>
<property>
    <!--hdfs namenode的通信地址-->
    <name>fs.defaultFS</name>
    <value>hdfs://192.168.119.129:9000</value>
</property>
<property>
    <name>hadoop.http.staticuser.user</name>
    <value>root</value>
</property>

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

修改/usr/local/hadoop/hadoop-3.1.3/etc/hadoop文件夹下的hdfs-site.xml配置文件

该文件指定与HDFS相关的配置信息。需要修改HDFS默认的块的副本属性,因为HDFS默认情况下每个数据块保存3个副本,而在伪分布式模式下运行时,由于只有一个数据节点,所以需要将副本个数改为1,否则Hadoop程序会报错

执行以下命令修改 hdfs-site.xml 文件:

vim hdfs-site.xml # 编辑 hdfs-site.xml 文件

打开 hdfs-site.xml 文件后,将其中的

<configuration>
</configuration>

修改为以下的配置:

<configuration>
<property>
    <!--指定HDFS储存数据的副本数目,默认情况下为3份-->
    <name>dfs.replication</name>
    <value>1</value>
</property>
<property>
    <!--name node 存放 name table 的目录-->
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/local/hadoop/tmp/dfs/name</value>
</property>
<property>
    <!--data node 存放数据 block 的目录-->
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>
<property>
  <!--设置监控页面的端口及地址-->
  <name>dfs.http.address</name>
  <value>0.0.0.0:50070</value>
</property>
</configuration>

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

修改/usr/local/hadoop/hadoop-3.1.3/etc/hadoop文件夹下的mapred-site.xml配置文件
vim mapred-site.xml

打开 mapred-site.xml文件后,将其中的

<configuration>
</configuration>

修改为以下的配置:

<configuration>
<property>
    <!-- 指定mapreduce 编程模型运行在yarn上 -->
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
</configuration>

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

修改/usr/local/hadoop/hadoop-3.1.1/etc/hadoop文件夹下的yarn-site.xml配置文件
vim yarn-site.xml

打开 mapred-site.xml文件后,将其中的

<configuration>
</configuration>

修改为以下的配置:

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<!-- 指定mapreduce 编程模型运行在yarn上 -->
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

分别编辑开始和关闭脚本

分别/usr/local/hadoop/hadoop-3.1.3/sbin 下的 start-dfs.sh 和 stop-dfs.sh , start-yarn.sh 和 stop-yarn.sh

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

vim start-dfs.sh

在最上方 #/usr/bin/env bash 下空白处添加以下内容

HDFS_DATANODE_USER=root 
HADOOP_SECURE_DN_USER=hdfs 
HDFS_NAMENODE_USER=root 
HDFS_SECONDARYNAMENODE_USER=root 

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

vim stop-dfs.sh

在最上方 #/usr/bin/env bash 下空白处添加以下内容

HDFS_DATANODE_USER=root 
HADOOP_SECURE_DN_USER=hdfs 
HDFS_NAMENODE_USER=root 
HDFS_SECONDARYNAMENODE_USER=root 

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

vim start-yarn.sh

在最上方 #/usr/bin/env bash 下空白处添加以下内容

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

vim stop-yarn.sh

在最上方 #/usr/bin/env bash 下空白处添加以下内容

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

格式化namenode,只格式化一次即可

cd 到/usr/local/hadoop/hadoop-3.1.3/etc/hadoop 目录下

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

执行

hadoop namenode -format

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

启动hadoop
start-all.sh

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

查看进程,检查是否启动
 jps

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

至此已经成功安装完成Hadoop (记得在防火墙里面放行以下的端口)

HDFS Web界面:自己的IP地址:50070

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

ResourceManager Web界面:自己的IP地址:8088

大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)文章来源地址https://www.toymoban.com/news/detail-404629.html

到了这里,关于大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop(01) Hadoop3.3.6安装教程,单机/伪分布式配置

    在安装 Hadoop 3.3.6 前,需要满足以下前置条件: Java Development Kit (JDK):Hadoop 是用 Java 编写的,因此需要安装并配置适当版本的 JDK。Hadoop 3.3.6 建议使用 JDK 8 或更高版本。确保正确安装 JDK,并设置 JAVA_HOME 环境变量。 SSH:Hadoop 集群中的节点需要通过 SSH 进行通信和管理。确保在

    2024年02月06日
    浏览(41)
  • 大数据技术栈-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超详细-小白注释版)虚拟机安装+平台部署

    目录 环境条件: 1、安装虚拟机(已安装好虚拟机的可跳转至  二、安装JDK与Hadoop) (1)直接新建一台虚拟机 (2)首次启用虚拟机,进行安装 一、集群前置环境搭建(三台机器分别设置hostname、网卡(ip)配置、ssh免密登录) 1、查看一下本机与虚拟机的网卡和ip信息 (1)

    2024年02月06日
    浏览(41)
  • Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置

    华为云耀云服务器试用领取 领取的试用云耀云服务器在哪 阿里云服务器免费试用领取 Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置 阿里云服务器ECS安装图形界面 本篇文章是基于上一篇所配置好的云服务器进行实验软件安装,该系列文章是根据林子雨所讲述的课程就在

    2024年01月21日
    浏览(46)
  • Hadoop3.3伪分布式安装部署

    目录 引言 实验目的及准备 实验步骤 引言 Hadoop生态的搭建有本地模式、伪分布模式、集群模式(3台机器)三种安装模式,本篇文章将详细介绍Hadoop3.3的伪分布安装模式。 实验目的及准备 一、完成Hadoop3.3伪分布安装 二、在Linux中配置jdk1.8环境变量 三、配置主机的免密钥登录

    2024年02月21日
    浏览(42)
  • Hadoop3.3.5最新版本安装分布式集群部署

    Index of /dist/hadoop/common https://archive.apache.org/dist/hadoop/common  集群规划: 注意: NameNode和SecondaryNameNode不要安装在同一台服务器 ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台机器上。 机器 ip 分配节点 node01 192.168.56.201 NameNode 、DataNode、NodeManager node02 192.

    2024年02月01日
    浏览(61)
  • 超详细Hadoop安装教程(单机版、伪分布式)

    Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop的框架最核心的设计就是: HDFS 和 MapReduce 。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了

    2024年02月08日
    浏览(49)
  • Hadoop3完全分布式搭建

    使用hostnamectl set-hostname 修改当前主机名 1,使用 systemctl stop firewalld systemctl disable firewalld 关闭防火墙 2,使用 vim /etc/selinux/config 修改为 SELINUX=disabled 1,修改网络配置 修改如下三项内容: BOOTPROTO=static ONBOOT=yes IPADDR=自己想要设置的IP。这个ip参考vmware的虚拟网络编辑器的vmnet8的

    2024年01月21日
    浏览(47)
  • Hadoop3.1.4分布式搭建

    1.1 实验网络规划 hostname ip addr role other k8s-m133 10.10.10.133 NameNode, DataNode, NodeManageer k8s-m134 10.10.10.134 SecondaryNameNode, DataNode, NodeManageer k8s-m135 10.10.10.135 ResourceManager, DataNode, NodeManageer k8s-n151 10.10.10.151 DataNode, NodeManageer k8s-n157 10.10.10.157 DataNode, NodeManageer 1.2 配置免密登录(所有节点) 1

    2024年02月06日
    浏览(36)
  • Hadoop3.1.4完全分布式集群搭建

    在Centos7中直接使用root用户执行hostnamectl命令修改,重启(reboot)后永久生效。 要求:三台主机的名字分别为:master slave1 slave2 关闭后,可查看防火墙状态,当显示disavtive(dead)的字样,说明CentOS 7防火墙已经关闭。 但要注意的是,上面的命令只是临时关闭了CentOS 7防火墙,

    2024年04月17日
    浏览(43)
  • 搭建Hadoop3.x完全分布式集群(CentOS 9)

    虚拟机相关: VMware workstation 16:虚拟机 vmware_177981.zip CentOS Stream 9:虚拟机 CentOS-Stream-9-latest-x86_64-dvd1.iso Hadoop相关 jdk1.8:JDK jdk-8u261-linux-x64.tar.gz Hadoop 3.3.6:Hadoop Hadoop 3.3.6.tar.gz 辅助工具 putty:tools putty.exe mtputty:tools mtputty.exe winscp:tools WinSCP-6.3.1-Portable.zip 本文相关资源可以

    2024年04月14日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包