基于Linux的Hadoop伪分布式安装

这篇具有很好参考价值的文章主要介绍了基于Linux的Hadoop伪分布式安装。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基于Linux的Hadoop伪分布式安装

1. hadoop用户设置

1.1 创建新用户(需注意权限问题:切换为root用户)

su root

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

1.2 添加新用户hadoop,并设置相关信息(一直回车默认就可以)

adduser hadoop

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

1.3 退出当前用户登录hadoop用户(或直接在Ubuntu中切换用户即可)

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

1.4 以管理员身份(root用户)执行指令visudo,来修改配置

su root

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

visudo

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

visudo打开的是/etc/sudoers文件,修改该文件,在root ALL=(ALL:ALL) ALL这一行下面加入一行:

hadoop ALL=(ALL:ALL) ALL

CTRL+O(然后再按ENTER)保存,CTRL+C取消,CTRL+X退出

1.5 退出root用户

exit

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2. 安装ssh

2.1 更新apt源(以免后续安装软件失败)

sudo apt-get update

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2.2 安装ssh服务端

sudo apt-get install openssh-server

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2.3 安装后使用以下命令登录本机:输入yes、输入密码即可登录

ssh localhost

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2.4 输入exit退出ssh

exit

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2.5 配置ssh免密登录

  • 进入ssh目录:
cd ~/.ssh/
  • 会有提示,都按回车就可以:
ssh-keygen -t rsa
  • 将密钥加入到授权中:
cat id_rsa.pub >> authorized_keys

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

2.6 使用 ssh localhost 试试是否能直接登录

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

3. 安装vim

执行如下命令下载并安装vim:

sudo apt-get install vim

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

4. 安装JDK并配置环境变量

4.1 安装openjdk-8-jdk

sudo apt-get install openjdk-8-jdk

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

4.2 查看Java版本,看看是否安装成功

java -version

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

4.3 将JDK安装路径改为上述命令得到的路径,并保存(也可以使用vim编辑)

gedit ~/.bashrc

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

4.4 让该环境变量生效,执行如下命令

source ~/.bashrc

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

4.5 查看是否是自己安装的Java路径以及对应的版本

echo $JAVA_HOME
java -version
whereis java

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5. 安装Hadoop

5.1 下载hadoop

hadoop下载网址:https://hadoop.apache.org/releases.html (速度较慢)

可以使用这个网址:http://archive.apache.org/dist/hadoop/core/hadoop-3.2.4/ (可以选择需要的版本)

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.2 解压(在你想安装的路径下进行解压,这里选择将hadoop安装到 /usr/local 中

sudo tar -zxf ~/下载/hadoop-3.2.4.tar.gz -C /usr/local

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.3 进入该文件夹,将文件夹名为hadoop

cd /usr/local/
sudo mv ./hadoop-3.2.4/ ./hadoop

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.4 修改文件权限

sudo chown -R hadoop ./hadoop

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.5 配置环境变量

gedit ~/.bashrc

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

#HADOOP VARIABLES START 
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL 
export HADOOP_COMMON_HOME=$HADOOP_INSTALL 
export HADOOP_HDFS_HOME=$HADOOP_INSTALL 
export YARN_HOME=$HADOOP_INSTALL 
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP VARIABLES END 

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.6 执行如下代码使其生效

source ~/.bashrc

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

5.7 可以用如下命令查看解压的hadoop是否是可用的

hadoop version

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

若如上图所示,hadoop已安装完成!

6. hadoop伪分布式配置

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.1 配置 hadoop-env.sh

gedit ./etc/hadoop/hadoop-env.sh

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

# The java implementation to use. 
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP=/usr/local/hadoop
export PATH=$PATH:/usr/local/hadoop/bin

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.2 配置 yarn-env.sh

gedit ./etc/hadoop/yarn-env.sh

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

# export JAVA_HOME
JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.3 配置 core-site.xml

gedit ./etc/hadoop/core-site.xml

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

<configuration>
        <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/usr/local/hadoop/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.4 配置 hdfs-site.xml

gedit ./etc/hadoop/hdfs-site.xml

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

<configuration>
        <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
             <name>dfs.datanode.data.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.5 配置 yarn-site.xml

gedit ./etc/hadoop/yarn-site.xml

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

<configuration> 
<!-- Site specific YARN configuration properties -->
    <property> 
        <name>yarn.nodemanager.aux-services</name> 
        <value>mapreduce_shuffle</value> 
    </property> 
    <property> 
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> 
        <value>org.apache.hadoop.mapred.ShuffleHandler</value> 
    </property> 
    <property> 
        <name>yarn.resourcemanager.address</name> 
        <value>127.0.0.1:8032</value> 
    </property> 
    <property> 
        <name>yarn.resourcemanager.scheduler.address</name> 
        <value>127.0.0.1:8030</value> 
    </property> 
    <property> 
        <name>yarn.resourcemanager.resource-tracker.address</name> 
        <value>127.0.0.1:8031</value> 
    </property> 
</configuration>

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

6.6 重启Ubuntu系统,验证Hadoop是否安装成功

hadoop version

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

7. 启动HDFS伪分布式模式

7.1 格式化namenode

hdfs namenode -format

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu
完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

7.2 启动hdfs

start-all.sh

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

7.3 显示进程(有6个进程表示正常)

jps

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

7.4 打开浏览器

输入:http://localhost:9870/

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu

输入:http://localhost:8088/

完成linux虚拟机的安装;完成hadoop单机和伪分布式安装,大数据技术,hadoop,大数据,hdfs,分布式,ubuntu文章来源地址https://www.toymoban.com/news/detail-779999.html

到了这里,关于基于Linux的Hadoop伪分布式安装的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux从零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

    和相关配置版本 :Linux CentOS Hadoop Java 版本: CentOS7 Hadoop3.2.0 JDK1.8 虚拟机参数信息内存3.2G、处理器2x2、内存50G ISO:CentOS-7-x86_64-DVD-2009.iso 基本主从思路: 先把基础的设置(SSH、JDK、Hadooop、环境变量、Hadoop和MapReduce配置信息)在一台虚拟机(master)上配好,通过

    2024年02月05日
    浏览(65)
  • Hadoop分布式安装

    首先准备好三台服务器或者虚拟机,我本机安装了三个虚拟机,安装虚拟机的步骤参考我之前的一篇 virtualBox虚拟机安装多个+主机访问虚拟机+虚拟机访问外网配置-CSDN博客 jdk安装 参考文档:Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并配置环境变量_Xi-Yuan的博客-CSDN博

    2024年02月08日
    浏览(50)
  • Hadoop分布式安装部署

    VMware Workstation Pro17 CentOS7 Hadoop-3.3.6 jdk1.8.0_391 事先需要在本地电脑安装VMware,再创建虚拟机,并且克隆该虚拟机,使用多台机器配合完成完全的分布式文件系统。本文使用三台虚拟机搭建Hadoop。 Hadoop在安装部署之前,需要对虚拟机进行网络配置,将虚拟机的网络状态由动态修

    2024年01月23日
    浏览(52)
  • Hadoop分布式集群安装

            上一篇大数据文章讲解了在单机上搭建Hadoop-Yarn 伪分布式集群的安装方法,方便大家学习,真实环境不可能只有一台机器,肯定是多节点的集群,大单位还会建设很多Hadoop集群,比如各个大部门有自己的集群,或者按热、温、冷来划分建立集群,反正都是很多台服

    2024年01月19日
    浏览(49)
  • Hadoop伪分布式安装配置

    1、添加用户组 [root@hadoop00 ~]# groupadd hadoop 2、添加用户并分配用户组 [root@hadoop00 ~]# useradd -g hadoop hadoop 3、修改hadoop用户密码 [root@hadoop00 ~]# passwd hadoop 1、上传系统安装镜像到虚拟机服务器的/root目录 2、新建挂载点目录 [root@hadoop00 ~]# mkdir /mnt/centos 3、挂载镜像        [root@h

    2024年01月24日
    浏览(46)
  • hadoop伪分布式安装部署

    首先jdk安装完毕 jdk安装文档参考: Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并配置环境变量_Xi-Yuan的博客-CSDN博客 准备好hadoop的安装包 我的下载地址如下: We Transfer Gratuit. Envoi sécurisé de gros fichiers. 将hadoop包上传到随便一个目录,但是解压缩到/opt/ 目录下 tar -zvxf

    2024年02月08日
    浏览(45)
  • Hadoop伪分布式安装搭建教程

    安装VMware虚拟机 下载Ubuntu 18.04镜像,并在VMware中新建虚拟机 安装VMware tools 搭建Hadoop伪分布式 1.安装VMware Workstation 14 Pro版本 2.1 在VMware上方菜单栏,文件--新建虚拟机  2.2 默认  2.3 选择稍后安装操作系统 2.4 选择Linux(L),版本 Ubuntu    2.5 定义虚拟机的名称,选择虚拟机的

    2023年04月09日
    浏览(38)
  • Hadoop的伪分布式安装方法

    实验环境: 操作系统:Linux (Ubuntu 20.04.5) Hadoop版本:3.3.2 JDK版本:1.8.0_162 hadoop与jdk的安装包可详见博客中: https://blog.csdn.net/weixin_52308622/article/details/131947961?spm=1001.2014.3001.5501 (1)创建 hadoop 用户(使用 /bin/bash 作为 Shell)、设置密码(建议简单)并为其添加管理员权限。具

    2024年02月14日
    浏览(40)
  • 【Hadoop】安装部署-完全分布式搭建

    Hadoop是一个适合大数据的分布式存储和计算平台。狭义上说Hadoop就是一个框架平台,广义上讲Hadoop代表大数据的一个技术生态圈,包括很多软件框架。而我们的完全分布式,指的是在真实环境下,使⽤多台机器,共同配合,来构建⼀个完整的分布式文件系统。在真实环境中,

    2024年02月07日
    浏览(48)
  • Docker安装Hadoop分布式集群

    hadoop目录安装在:/usr/local/hadoop-2.7.0/etc/hadoop

    2024年02月13日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包