hadoop伪分布式搭建（超详细）

1年前作者：@北惜分类：Toy博客阅读(6)违法举报

这篇具有很好参考价值的文章主要介绍了hadoop伪分布式搭建（超详细）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

上一篇文章已经为大家介绍了如何在Linux系统上配置java环境，这为hadoop的集群搭建提供了基础条件，因为Hadoop是由Java编写的

如果还没有在虚拟机配置java系统的小伙伴可以先看一下我的第一篇文章:https://blog.csdn.net/beixige/article/details/129112527

接下来是hadoop伪分布搭建的要准备东西：
jdk1.8.0_221
hadoop-2.7.7
我都打包提供给大家了，下载地址：https://share.weiyun.com/dk7WgaVk
密码：553ubk

下面正式开始吧！

一.实现免密登陆

1. 创建ssh秘钥，输入如下命令，生成公私密钥

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

2.将master公钥id_dsa复制到master进行公钥认证，实现本机免密登陆，测试完exit退出

ssh-copy-id -i /root/.ssh/id_dsa.pub master
ssh master
exit

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

二.Hadoop环境的安装与配置

1. 将/root/runajian下的hadoop-2.7.7.tar.gz压缩包解压到/opt目录下，并将解压文件改名为hadoop

tar -zvxf /root/ruanjian/hadoop-2.7.7.tar.gz -C /opt
mv hadoop-2.7.7 hadoop

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

2.修改环境变量

vim /etc/profile

3.按键Shift+g键定位到最后一行，按键 i 切换到输入模式下，添加如下代码：

export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

4.按键ESC,按键:wq 保存并退出

5.生效刚刚的配置

source /etc/profile

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

6.编辑/opt/hadoop/etc/hadoop/hadoop-env.sh文件，操作如下:

vi /opt/hadoop/etc/hadoop/hadoop-env.sh

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

7. 按键 :set nu 回车设置行号

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

8.按键25gg定位到25行，部分截图如下:

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

9.按键dd删除此行，部分截图如下:

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

10.按键i，插入以下代码，注：根据自己的java路径而定

export JAVA_HOME=/opt/java

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

11.按键ESC 按键:wq 回车保存并退出

12.编辑/opt/hadoop/etc/hadoop/core-site.xml文件，部分截图如下：

vi /opt/hadoop/etc/hadoop/core-site.xml

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

13. 按键 :set nu 回车设置行号

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

14.按键19gg定位到19行，按键o添加如下代码，部分截图如下

<property>
<name>fs.defaultFS</name>
<value>hdfs://master</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/tmp</value>
</property>

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

15.按键Esc,按键:wq保存退出

16.编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件,部分截图如下

vi /opt/hadoop/etc/hadoop/hdfs-site.xml

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

17. 按键 :set nu 回车设置行号

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

18.按键20gg定位到20行，按键i添加如下代码

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

19.按键Esc,按键:wq保存退出

20.复制/opt/hadoop/etc/hadoop/mapred-site.xml.tmplate 名为mapred-site.xml

cp /opt/hadoop/etc/hadoop/mapred-site.xml.template /opt/hadoop/etc/hadoop/mapred-site.xml

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

21.编辑/opt/hadoop/etc/hadoop/mapred-site.xml文件,部分截图如下

vi /opt/hadoop/etc/hadoop/mapred-site.xml

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

22.按键:set nu回车，设置行号

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

23.按键20gg定位到20行,按键i添加如下代码

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

24.按键Esc,按键:wq保存退出

25.编辑/opt/hadoop/etc/hadoop/yarn-site.xml文件,部分截图如下:

vi /opt/hadoop/etc/hadoop/yarn-site.xml

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

26.按键:set nu回车，设置行号

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

27.按键18gg定位到18行,按键i添加如下代码，部分截图如下

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

28.按键Esc,按键:wq保存退出

29.编辑/opt/hadoop/etc/hadoop/slaves文件

vim /opt/hadoop/etc/hadoop/slaves

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

30.按键dd删除首行，按键i添加如下内容

master

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

31.按键Esc,按键:wq保存退出

32.切换到机器上，命令行中执行如下指令，格式化hdfs，部分截图如下

hdfs namenode -format

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

33.机器命令行中执行如下指令,启动集群，启动过程中出现“are you sure you want to continue connecting”，输入yes。

start-all.sh

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs

34.机器命令行中执行如下指令,查看进程

jps

伪分布式hadoop集群搭建过程,大数据技术学习,hadoop,分布式,hdfs 文章来源地址https://www.toymoban.com/news/detail-773186.html

35.如上图所示，所有配置完成，进程启动完毕

ps:连续三晚5000+字教程不易，如果对正在看的小伙伴们有帮助恳请留下一赞~

到了这里，关于hadoop伪分布式搭建（超详细）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive 完全分布式高可用集群搭建(保姆级超详细含图文)
说明: 本篇将详细介绍用二进制安装包部署hadoop等组件，注意事项，各组件的使用，常用的一些命令，以及在部署中遇到的问题解决思路等等，都将详细介绍。 ip hostname 192.168.1.11 node1 192.168.1.12 node2 192.168.1.13 node3 1.2.1系统版本 1.2.2内存建议最少4g、2cpu、50G以上的磁盘容量本次
2024年02月12日
浏览(15)
Hadoop分布式集群搭建教程
大数据课程需要搭建Hadoop分布式集群，在这里记录一下搭建过程搭建Haoop分布式集群所需环境： VMware：VMware-workstation-full-17.0.2-21581411 CentOS：CentOS-7-x86_64-DVD-2003， Hadoop：hadoop-3.1.3.tar JDK：jdk-8u212-linux-x64.tar.gz 新建虚拟机设置用户命名虚拟机自定义硬件，完成虚拟机创建开始
2024年02月08日
浏览(8)
Hadoop完全分布式集群搭建
1.在虚拟机关机的状态下选择克隆 2.开始克隆 3.选择从当前状态创建 4.创建一个完整的克隆 5.选择新的虚拟机存储位置（选择内存充足的磁盘） 6.开始克隆 7.克隆完成 8.同样的方法克隆第二台虚拟机 9.在计算机中存在三台虚拟机将第一台虚拟机更名为hadoop01 修改hadoop01的主机
2024年02月02日
浏览(5)
【Hadoop】完全分布式集群搭建
大家好，我是向阳花花花花，这篇文章是我历时三天，推翻重做两小时进行搭建的Hadoop集群（完全分布式）个人笔记和感想，收录于初心的《大数据》专栏。 🏠 个人主页：初心%个人主页 🧑 个人简介：大家好，我是初心，一名正在努力的双非二本院校计算机专业学生 💕
2024年02月15日
浏览(10)
HADOOP 伪分布式集群搭建
由于笔者这里使用的是vmware 虚拟机采用centos7 linux 操作系统进行搭建，所以一下示例均以centos7进行示例 1. 搭建vmware 虚拟机（1）创建好虚拟机后采用linux ISO镜像文件启动安装centos7操作系统（其它方式也可以）（2）完成之后设置网络模式，笔者采用桥接模式进行设置
2024年02月01日
浏览(6)
Hadoop 完全分布式集群搭建
部署前可以先了解下 Hadoop运行模式及目录结构-CSDN博客服务 hadoop102 hadoop103 hadoop104 NameNode √ DataNode √ √ √ Secondary NameNode √ ResourceManager √ NodeManager √ √ √ JobHistoryServer √ IPv4 192.168.88.102 192.168.88.103 192.168.88.104 NodeObject master worker1 worker2 最小化安装 Neokylin7.0 用于搭建 Had
2024年02月04日
浏览(20)
Hadoop分布式集群搭建（三台虚拟机）
搭建好VMware Workstation Pro（我这里装的版本是16）搭建hadoop集群需要三台虚拟机 1.新建虚拟机——自定义（高级） 2.不用改动，点击下一步 3.映像文件稍后再加入 4.选择Linux——CentOS 7 64位 5.可以在存放虚拟机的文件内新建一个文件夹，专门放hadoop集群需要的虚拟机（有三
2024年02月08日
浏览(12)
hadoop-3.3.3完全分布式集群搭建
随着大数据的不断发展，hadoop在前段时间就已经更新到了3.x版本，与2.x版本存在着一些差异，在某大数据竞赛中也是使用的hadoop3.x的版本，本文就介绍hadoop3.x版本的完全分布式集群搭建。 jdk：1.8 hadoop：3.3.3 操作系统：centos7 需要的所有安装包都放在master节点的/opt目录下，安
2024年02月09日
浏览(11)
分布式集群——搭建Hadoop环境以及相关的Hadoop介绍
分布式集群——jdk配置与zookeeper环境搭建分布式集群——搭建Hadoop环境以及相关的Hadoop介绍文章目录前言一 hadoop的相关概念 1.1 Hadoop概念补充：块的存储 1.2 HDFS是什么 1.3 三种节点的功能 I、NameNode节点 II、fsimage与edits文件存放的内容介绍 III、DataNode节点 IV、SecondaryNameNod
2024年02月10日
浏览(7)
【教程】Hadoop完全分布式环境搭建全过程
保姆级入门教程：图片讲解 + 各种问题解决方案集群服务器：hadoop102、hadoop103和hadoop104 虚拟机版本：CentOS7-1804 资源分享处（文章最后）提供CentOS7和Hadoop各组件压缩包（也可以自行下载，要注意版本兼容的问题），有需要自取~ 1，模板虚拟机准备 2，克隆三台虚拟机，作为
2024年02月06日
浏览(12)