【云计算】Hadoop环境搭建

这篇具有很好参考价值的文章主要介绍了【云计算】Hadoop环境搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、环境准备

二、把Linux系统设置成固定IP

 三、建立Hadoop用户

  3.1、创建hadoop用户

 3.2、修改 hadoop 用户权限

 3.3、切换为 hadoop 用户

3.4、更新源 

 3.5、检查 SSH服务

3.6、配置 SSH 无密码登录

四、 安装 Java 环境

五、安装hadoop

 六、Hadoop单机配置

         使用MapReduce测试单词出现的次数

 七、Hadoop 伪分布式配置

   7.1修改配置文件,运行HDFS分布式文件系统

 7.2修改 core-site.xml 文件

7.3修改 hdfs-site.xml 文件 

 7.4修改 hadoop-env.sh 配置文件

7.5 NameNode 格式化

 7.6开启 NameNode 和 DataNode

7.7使用浏览器访问web界面 


一、环境准备

 VMware 15  版本以上

Linux CenterOS 7 64位        【linux学习笔记】红帽Linux 7.8系统在虚拟机上的安装_Ein hübscher Kerl.的博客-CSDN博客_红帽linux 虚拟机

Xshell           5

【Linux学习笔记】远程控制Linux主机_Ein hübscher Kerl.的博客-CSDN博客_linux远程主机

JDK             1.8

Hadoop      3.1.3 

二、把Linux系统设置成固定IP

Linux设置静态IP在/etc/sysconfig/network-scripts/ifcfg-ens33文件中,在文件中设置固定IP即可,这里IP固定为192.168.170.130

 vi /etc/sysconfig/network-scripts/ifcfg-ens33

TYPE=Ethernet

PROXY_METHOD=none

BROWSER_ONLY=no

BOOTPROTO=static            #dhcp改为static

DEFROUTE=yes

IPV4_FAILURE_FATAL=no

IPV6INIT=yes

IPV6_AUTOCONF=yes

IPV6_DEFROUTE=yes

IPV6_FAILURE_FATAL=no

IPV6_ADDR_GEN_MODE=stable-privacy

NAME=ens33

UUID=af2872df-87b6-4dfe-8f46-aaeb08fd8074

DEVICE=ens33

ONBOOT=yes

IPADDR=192.168.170.130    #增加一下内容

NETMASK=255.255.255.0

GATEWAY=192.168.170.1

DNS1=202.101.224.68

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

reboot   #修改完IP需要重启一下

 查看网关命令route -n

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 三、建立Hadoop用户

       Linux权限最高的是root用户,但是搭建Hadoop环境必须创建一个普通用户,使用普通用户来搭建环境,千万不要用root用户搭建,会出现一些意想不到的问题。

  3.1、创建hadoop用户

使用root用户来创建hadoop用户,用户与用户组都是hadoop

[root@localhost ~] useradd hadoop    #创建hadoop用户,用户组也是hadoop

 设置hadoop密码需要输入两次,这里密码设置为:hadoop

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 3.2、修改 hadoop 用户权限

       hadoop用户为普通用户,系统会对普通用户的一些操作进行限制,这里我们需要为hadoop用户增加管理员权限,之后便可以使用 sudo 命令进行一些限制操作,编辑/etc/sudoers文件给hadoop用户增加管理员权限,红色字就是新增的内容。

[root@localhost ~]# vi /etc/sudoers

## The COMMANDS section may have other options added to it.

##

## Allow root to run any commands anywhere

root    ALL=(ALL)       ALL

hadoop  ALL=(ALL)       ALL

## Allows members of the 'sys' group to run networking, software,

## service management apps and more.

# %sys ALL = NETWORKING, SOFTWARE, SERVICES, STORAGE, DELEGATING, PROCESSES, LOCATE, DRIVERS

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 3.3、切换为 hadoop 用户

目前使用的是root用户,现在需要切换成hadoop用户进行操作 

[root@localhost ~]# su hadoop
[hadoop@localhost root]$ cd
[hadoop@localhost ~]$  

3.4、更新源 

      我们在下载软件时,可能会因为网络原因而下载失败,因此我们选择更新软件源,输入以下命令更新软件源,我们现在登录的用户是hadoop,因此需要使用 sudo 命令来进行需要 root 权限的操作

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java 注:如果从来没有更新过系统,这里需要等待一段时间

 3.5、检查 SSH服务

       集群、单机模式都需要用到 SSH 登陆(类似于远程登陆,你可以登录某台 Linux 主机,并且在上面运行命令),在使用 SSH 登陆服务之前,我们需要先输入 yum list installed | grep openssh-server 命令检测 openssh-server 是否安装,有信息输出表示已安装,无信息输出表示未安装。

 希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

如果未安装,则无任何输出,安装 openssh-server 命令为:sudo yum install openssh-server

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

3.6、配置 SSH 无密码登录

确定 openssh-server 已安装后,我们就可以愉快的使用 SSH 服务了,输入 ssh localhost 命令登陆本机:

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

按照以上的登陆方式:每次登陆都需要输入密码,很不方便,因此我们需要配置成SSH无密码登陆,更方便一点。具体操作如下:

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

cat ./id_rsa.pub >> ./authorized_keys     # 加入授权

chmod 600 authorized_keys          # 更改文件权限

四、 安装 Java 环境

 第一步:指定java的安装路径,这里我们把java安装到/usr/java目录下

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 第二步:把jdk安装包上传到/usr/java目录下,进行解压

[hadoop@localhost usr]$ cd /usr/java                #进入到/usr/java目录下

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 [hadoop@localhost java]$ sudo tar -xzvf jdk-8u221-linux-x64.tar.gz     #解压

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

第三步:配置环境变量,编辑/etc/profile文件进行添加环境变量

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java #文档末尾增加以下信息                                                                  

export JAVA_HOME=/usr/java/jdk1.8.0_221

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH

export JAVA_PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin

export PATH=$PATH:${JAVA_PATH}

第四步:执行java版本命令,检查java是否安装成功

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

五、安装hadoop

 第一步:指定hadoop的安装路径,这里我们把hadoop安装到/usr/hadoop目录下,一定要把hadoop文件夹的所属主与所属组改成hadoop,否则运行会没有权限

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 第二步:使用Xftp把hadoop安装包上传到/usr/hadoop目录下,进行解压

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 第三步:配置环境变量,编辑/etc/profile文件进行添加环境变量

#文档末尾增加以下信息                                               

export HADOOP_HOME=/usr/hadoop/hadoop-3.1.3   

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 第四步:执行hadoop版本命令,检查hadoop是否安装成功

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 六、Hadoop单机配置

         使用MapReduce测试单词出现的次数

在/usr/hadoop/下创建一个input文件夹,在此文件夹中创建一个word.txt,在文件中随机写一些英文单词,统计每个英文单词的次数希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 七、Hadoop 伪分布式配置

   7.1修改配置文件,运行HDFS分布式文件系统

Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode,同时,其读取的是 HDFS 中的文件。

Hadoop 的配置文件位于 /usr/hadoop/hadoop-3.1.3/etc/hadoop/ 中,伪分布式需要修改 2 个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式,每个配置以声明 property 的 name 和 value 的方式来实现。

 7.2修改 core-site.xml 文件

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

添加内容

 <property>

        <name>hadoop.tmp.dir</name>

        <value>file:/usr/hadoop/tmp</value>

        <description>Abase for other temporary directories.</description>

    </property>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://localhost:9000</value>

    </property>

7.3修改 hdfs-site.xml 文件 

 希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 添加内容

<property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/hadoop/tmp/dfs/name</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/hadoop/tmp/dfs/data</value>

</property>

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 7.4修改 hadoop-env.sh 配置文件

在 hadoop-env.sh 文件里找到 # export JAVA_HOME= 这行,如下所示:export JAVA_HOME=/usr/java/jdk1.8.0_221

[hadoop@localhost hadoop]$ vi hadoop-env.sh

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

7.5 NameNode 格式化

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 格式化成功

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 7.6开启 NameNode 和 DataNode

 希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

7.7使用浏览器访问web界面 

成功启动后,可以在浏览器上访问 Web 界面 http://192.168.170.130:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件,记得关闭Linux防火墙,否则外部无法访问。

【Linux学习笔记】管理Linux操作系统:简单的关闭防火墙_Ein hübscher Kerl.的博客-CSDN博客_termux关闭防火墙

希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 进行访问希冀平台云计算云实验hadoop,# Hadoop笔记,hadoop,云计算,java

 安装包下载地址

链接:https://pan.baidu.com/s/1sCmMTFrt3VPKFIUtlG9x2w?pwd=ydd9 
提取码:ydd9 文章来源地址https://www.toymoban.com/news/detail-796566.html

到了这里,关于【云计算】Hadoop环境搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 云计算实验——Hadoop实验

    2024年02月03日
    浏览(42)
  • 云计算技术 实验三 安装Hadoop系统并熟悉hadoop命令

    参考资料为: 教材代码-林子雨编著《大数据基础编程、实验和案例教程(第2版)》教材所有章节代码_厦大数据库实验室博客 1 . 实验学时 4学时 2 . 实验目的 熟悉Hadoop系统的安装 掌握Hadoop系统的两种安装方式 掌握Hadoop系统的基本命令 3 . 实验内容 安装虚拟机和Linux环境。

    2024年02月07日
    浏览(41)
  • 大数据导论实验一:搭建Hadoop集群

    一、实验要求 (10%) 搭建Hadoop集群,要求至少是3个节点的真分布式集群系统,包含1个NameNode,两个DataNode。 集群的安装配置大致为如下流程: 1)准备3台客户机(关闭防火墙、静态IP、主机名称) 2)安装JDK 3)配置环境变量 4)安装Hadoop 5)配置环境变量 6)配置集群 7)单点

    2024年02月02日
    浏览(48)
  • Hadoop——Windows系统下Hadoop单机环境搭建

    为了便于开发,我在本地Windows系统进行Hadoop搭建。 我使用的版本:hadoop-2.7.0。其他版本也可,搭建流程基本一样,所以参考这个教程一般不会有错。 1、下载安装包和插件 安装包hadoop-2.7.0.tar.gz 必要插件winutils-master 2、解压安装包 使用管理员身份运行cmd,到安装包对应目录下

    2024年02月09日
    浏览(53)
  • 【hadoop】windows上hadoop环境的搭建步骤

    在大数据开发领域中,不得不说说传统经典的hadoop基础计算框架。一般我们都会将hadoop集群部署在服务器上,但是作为一个资深搬砖人,我们本地环境也需要一个开发hadoop的开发环境。那么,今天就安排一个在windows上搭建一个hadoop环境。 docker部署hadoop请移步 下载hadoop安装包

    2024年02月12日
    浏览(39)
  • hadoop平台完全分布式搭建

    安装前准备 一、设置ssh免密登录 1.编辑hosts文件,添加主机名映射内容 vim  /etc/hosts 添加内容: 172.17.0.2      master 172.17.0.3      slave1 172.17.0.4      slave2 2.生成公钥和私钥 ssh-keygen –t rsa 然后按三次回车 3.复制公钥到其他容器(包括自己) ssh-copy-id master ssh-copy-id slav

    2024年03月17日
    浏览(48)
  • Hadoop大数据平台搭建(超详细步骤)

    相关软件下载链接: Xshell:家庭/学校免费 - NetSarang Website Xftp:家庭/学校免费 - NetSarang Website Xshell与Xftp官网:XSHELL - NetSarang Website Jdk:百度网盘 请输入提取码  提取码:jdhp Hadoop:百度网盘 请输入提取码   提取码:jdhp 需要配置好的虚拟机与相关环境的,可以点击我的这篇

    2023年04月12日
    浏览(78)
  • 分布式计算平台 Hadoop 简介

    Hadoop是一种分析和处理大数据的软件平台,是一个用Java语言实现的Apache的开源软件框架,在大量计算机组成的集群中实现了对海量数据的分布式计算。其主要采用MapReduce分布式计算框架,包括根据GFS原理开发的分布式文件系统HDFS、根据BigTable原理开发的数据存储系统HBase以及

    2024年02月01日
    浏览(61)
  • 分布式集群——搭建Hadoop环境以及相关的Hadoop介绍

    分布式集群——jdk配置与zookeeper环境搭建 分布式集群——搭建Hadoop环境以及相关的Hadoop介绍 文章目录 前言 一 hadoop的相关概念 1.1 Hadoop概念 补充:块的存储 1.2 HDFS是什么 1.3 三种节点的功能 I、NameNode节点 II、fsimage与edits文件存放的内容介绍 III、DataNode节点 IV、SecondaryNameNod

    2024年02月10日
    浏览(55)
  • Hadoop运行环境搭建

    0)安装模板虚拟机,IP 地址 192.168.10.100 、主机名称 hadoop100 、内存 4G 、硬盘 50G 1)hadoop100 虚拟机配置要求如下 1.使用 yum 安装需要虚拟机可以正常上网,yum 安装前可以先测试下虚拟机联网情 况

    2024年02月13日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包