Hadoop简介以及集群搭建详细过程

1年前作者：fiveym分类：Toy博客阅读(9)违法举报

这篇具有很好参考价值的文章主要介绍了Hadoop简介以及集群搭建详细过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

hadoop集群简介

hadoop加群包括两个集群：hdfs集群，yarn集群
两个集群逻辑上分离，通常物理上在一起
两个集群都是标准的主从架构集群

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

逻辑上分离：两个集群相互之间没有依赖，互不影响
物理上在一起：某些角色今晚往往部署在同一台物理服务器上
MapReduce集群呢？
- MapReduce是计算框架、代码层面的组件没有集群之说

hadoop部署模式

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

Hadoop集群安装

1.集群角色规划

角色规划的准则
- 根据软件工作特性和服务器硬件资源情况合理分配
- 比如依赖内存工作的namanode是不是不花在大内存机器上
角色规划注意事项
- 资源上有抢夺冲突的，尽量不要部署在一起
- 共偶作上需要相互配合的，尽量部署在一起

2.服务器基础环境准备

防火墙关闭(三台机器)
- systemctl stop firewalld. service #关闭防火墙
- systemtl disable firewalld. service #禁止防火墙开启自启
ssh免密登录(node1执行—>node1|node2|node3)
- ssh-keygen #四个回车生成公钥、私钥
- ssh-copy-id node1，ssh-cpoy-id node2，ssh-coppy-id node3
集群时间同步(三台机器)
- yum -y install ntpdata
- ntpdate ntp2.aliyun.com
JDK 1.8安装(三台机器)

3.上传安装包

创建同一工作目录(三台机器)
- mkdir -p /export/server/ #软件安装路径
- mkdir -p /export/data/ #数据安装路径
- mkdir -p /export/softwarw/ #安装包存放路径
上传、解压安装包

hadoop-3.1.4-bin-snappy-CentOS7.tar.gz
tar zvxf hadoop-3.1.4-bin-snappy-CentOS7.tar.gz -C /export/server

hadoop安装包目录结构

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

5.编辑hadoop配置文件

hadoop-env.sh
- cd /esport/server/hadoop-3.1.4/etc/hadoop/
- vim hadoop-env.sh

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

core-site.xml
- cd /export/server/hadoop-3.1.4/etc/hadoop/
- vim sore-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

hafs-site.xml
- cd /export/server/hadoop-3.1.4/etc/hadoop/
- vim hdfs-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

mapred-site.xml
- cd /export/server/hadoop-3.1.4/etc/hadoop/
- vim mared-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

yarn-site.xml
- cd /export/server/hadoop3.1.4/etc/hadoop
- vim yarn-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

workers
- cd /export/server/hadoop-3.1.4/etc/hadoop
- vim workers

6.分发安装包

在node1机器上奖hadoop安装包scp同步到其他机器
- cd /export/server/
- scp -r hadoop-3.1.4 root@node2: /export/server/
- scp -r hadoop-3.1.4 root@node3: /export/server/

7.配置hadoop环境变量

在node1上配置hadoop换件变量
- vim /etc/profile
- export HADOOP_HOME=/export/server/hadoop-3.1.4
- export PATH= $P A T H :$ HADOOP_HOME/bin:$HADOOP_HOME/bin
将修改后的环境变量同步到其他机器
- scp /etc/profile root@node2:/etc/
- scp /etc/profile root@node3:/etc/
重新加载环境变量，验证是否生效(三台机器)
- sourece /etc/profile
- hadoop #验证是否生效

8.NameNode format(格式化操作)

首次启动hdfs时，必须对齐进行格式化操作
format本质上是初始化工作，进行hdfs清理和准备工作
命令：hdfs namenode -format

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式文章来源地址https://www.toymoban.com/news/detail-601754.html

首次启动之前需要format操作
format只能进行一次，后续不在需要
如果多次format除了造成数据丢失外，还会导致hdfs集群主从角色之间互不识别，通过删除所有机器hadoop.tmp.dir目录重新format解决

hadoop集群启动关闭-手动逐个进程启停

每台机器上每次手动启动关闭一个角色进程
hdfs集群
- hafs --daemon start namenode|datanode|decondarynamenoe
- hafs --daemon stop namenode|datanode|decondarynamenoe
yarn集群
- yarn --daemon start resourcemanager|nodemanager
- yarn --daemon stop resourcemanager|nodemanager

shell脚本一键启停

在node1上，使用软件自带的shell脚本一键启动
前提：配置好机器之间的shh免密登录和workers文件
hdfs集群
- start-dfs.sh
- stop-dfs.sh
yarn集群
- start-yarn.sh
- stop-yarn.sh
hadoop集群
- start-all.sh
- stop-all.sh

到了这里，关于Hadoop简介以及集群搭建详细过程的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

头歌Hadoop 开发环境搭建及HDFS初体验（第2关：配置开发环境 - Hadoop安装与伪分布式集群搭建）
注： 1 头歌《Hadoop 开发环境搭建及HDFS初体验》三关在一个实验环境下，需要三关从前往后按顺序评测，跳关或者实验环境结束后重新打开不能单独评测通过 2 复制粘贴请用右键粘贴，CTRL+C/V不管用哦~ 第1关：配置开发环境 - JavaJDK的配置：解压：配置环境变量：细节： vi
2024年02月08日
浏览(173)
Hadoop入门详解以及Hadoop集群搭建
hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。hadoop充分利用了集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（Distributed File System），其中一个组件是HDFS（Hadoop Distributed File System），
2024年02月04日
浏览(8)
HDFS HA 集群搭建 - 基于Quorum Journal Manager（hadoop2.7.1）
在Hadoop分布式文件系统（HDFS）中，检查点（Checkpointing）是一个关键的过程，它涉及到将文件系统的命名空间状态持久化到磁盘。这个状态由两部分组成：EditLogs和FsImage。 EditLogs：记录了自FsImage生成后对文件系统所做的所有修改。每次对文件系统的修改都会追加到EditLogs中。
2024年01月16日
浏览(10)
分布式集群——搭建Hadoop环境以及相关的Hadoop介绍
分布式集群——jdk配置与zookeeper环境搭建分布式集群——搭建Hadoop环境以及相关的Hadoop介绍文章目录前言一 hadoop的相关概念 1.1 Hadoop概念补充：块的存储 1.2 HDFS是什么 1.3 三种节点的功能 I、NameNode节点 II、fsimage与edits文件存放的内容介绍 III、DataNode节点 IV、SecondaryNameNod
2024年02月10日
浏览(11)
Hadoop-HDFS详解与HA，完全分布式集群搭建(细到令人发指的教程)
本篇篇幅较长，有许多集群搭建干货，和枯燥乏味但是面试可能问到的理论知识。思来想去不知道怎样才能鼓励自己加油学习，想想要面对的生活还是假吧意思打开学习视频吧。目录一、引入 hdfs是什么 hdfs的由来 hdfs架构体系 hdfs的优缺点优点缺点二、HDFS_block简介和注意
2023年04月19日
浏览(37)
Hadoop集群环境搭建（超详细）
Oracle Linux 7.4 JDK 1.8 Hadoop 2.7.4 1.实验准备三台机器分别为master,slave1,slave2 2.单击master机器桌面中的konsole图标 1.编辑/etc/hosts文件,出现如下界面 [Command 001]： 2.按i键，如下图 3.第一行前面添加#，如下图 4.按键ESC，按键:wq回车，保存退出。如下图 5.切换到slave1机器，重复1~4步骤 6
2024年02月07日
浏览(25)
Hadoop集群搭建安装教程（详细完整）
大数据：最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡，大数据是当前很热的一个词。这几年来，云计算、继而大数据，成了整个社会的热点，大数据究竟是什么东西?有哪些相关技术? Hadoop是Apache旗下的一个用java语言实现开源软件框架，是一个开发和运行处理
2024年02月08日
浏览(9)
hadoop完全分布式集群搭建（超详细）-大数据集群搭建
本次搭建完全分布式集群用到的环境有： jdk1.8.0 hadoop-2.7.7 本次搭建集群所需环境也给大家准备了，下载链接地址：https://share.weiyun.com/dk7WgaVk 密码：553ubk 本次完全分布式集群搭建需要提前建立好三台虚拟机，我分别把它们的主机名命名为:master,slave1,slave2 一.配置免密登陆首先
2024年02月10日
浏览(16)
基于Hadoop搭建Flink集群详细步骤
目录 1.xftp上传flink压缩包至hadoop102的/opt/software/目录下 2.解压flink压缩包至/opt/module/目录下 3. 配置flink-conf.yaml 4.配置masters 5.配置workers 6.配置环境变量my_env.sh 7.重启环境变量 8.分发/opt/module/flink-1.13.0和/etc/profile.d/my_env.sh 9.另外两台重启环境变量 10.开启hadoop集群和flink集群 11.浏
2024年02月09日
浏览(13)
Hadoop 3.2.4 集群搭建详细图文教程
目录一、集群简介二、Hadoop 集群部署方式三、集群安装 3.1 集群角色规划 3.2 服务器基础环境准备 3.2.1 环境初始化 3.2.2 ssh 免密登录（在 hadoop01 上执行） 3.2.3 各个节点上安装 JDK 1.8 环境 3.3 安装 Hadoop 3.4 Hadoop 安装包目录结构 3.5 编辑 Hadoop 配置文件 3.5.1 hado
2024年02月09日
浏览(17)