Hadoop简介以及集群搭建详细过程

这篇具有很好参考价值的文章主要介绍了Hadoop简介以及集群搭建详细过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

hadoop集群简介

  • hadoop加群包括两个集群:hdfs集群,yarn集群
  • 两个集群逻辑上分离,通常物理上在一起
  • 两个集群都是标准的主从架构集群

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • 逻辑上分离:两个集群相互之间没有依赖,互不影响
  • 物理上在一起:某些角色今晚往往部署在同一台物理服务器上
  • MapReduce集群呢?
    • MapReduce是计算框架、代码层面的组件没有集群之说
      Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

hadoop部署模式

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

Hadoop集群安装

1.集群角色规划

  • 角色规划的准则
    • 根据软件工作特性和服务器硬件资源情况合理分配
    • 比如依赖内存工作的namanode是不是不花在大内存机器上
  • 角色规划注意事项
    • 资源上有抢夺冲突的,尽量不要部署在一起
    • 共偶作上需要相互配合的,尽量部署在一起
      Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

2.服务器基础环境准备

  • 防火墙关闭(三台机器)
    • systemctl stop firewalld. service #关闭防火墙
    • systemtl disable firewalld. service #禁止防火墙开启自启
  • ssh免密登录(node1执行—>node1|node2|node3)
    • ssh-keygen #四个回车 生成公钥、私钥
    • ssh-copy-id node1,ssh-cpoy-id node2,ssh-coppy-id node3
  • 集群时间同步(三台机器)
    • yum -y install ntpdata
    • ntpdate ntp2.aliyun.com
  • JDK 1.8安装(三台机器)

3.上传安装包

  • 创建同一工作目录(三台机器)
    • mkdir -p /export/server/ #软件安装路径
    • mkdir -p /export/data/ #数据安装路径
    • mkdir -p /export/softwarw/ #安装包存放路径
  • 上传、解压安装包
hadoop-3.1.4-bin-snappy-CentOS7.tar.gz
tar zvxf hadoop-3.1.4-bin-snappy-CentOS7.tar.gz -C /export/server

hadoop安装包目录结构

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

5.编辑hadoop配置文件

  • hadoop-env.sh
    • cd /esport/server/hadoop-3.1.4/etc/hadoop/
    • vim hadoop-env.sh

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • core-site.xml
    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim sore-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • hafs-site.xml

    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim hdfs-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • mapred-site.xml

    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim mared-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • yarn-site.xml

    • cd /export/server/hadoop3.1.4/etc/hadoop
    • vim yarn-site.xml

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

  • workers

    • cd /export/server/hadoop-3.1.4/etc/hadoop
    • vim workers
      Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

6.分发安装包

  • 在node1机器上奖hadoop安装包scp同步到其他机器
    • cd /export/server/
    • scp -r hadoop-3.1.4 root@node2: /export/server/
    • scp -r hadoop-3.1.4 root@node3: /export/server/

7.配置hadoop环境变量

  • 在node1上配置hadoop换件变量
    • vim /etc/profile
    • export HADOOP_HOME=/export/server/hadoop-3.1.4
    • export PATH= P A T H : PATH: PATH:HADOOP_HOME/bin:$HADOOP_HOME/bin
  • 将修改后的环境变量同步到其他机器
    • scp /etc/profile root@node2:/etc/
    • scp /etc/profile root@node3:/etc/
  • 重新加载环境变量,验证是否生效(三台机器)
    • sourece /etc/profile
    • hadoop #验证是否生效
      Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

8.NameNode format(格式化操作)

  • 首次启动hdfs时,必须对齐进行格式化操作
  • format本质上是初始化工作,进行hdfs清理和准备工作
  • 命令:hdfs namenode -format

Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式文章来源地址https://www.toymoban.com/news/detail-601754.html

  • 首次启动之前需要format操作
  • format只能进行一次,后续不在需要
  • 如果多次format除了造成数据丢失外,还会导致hdfs集群主从角色之间互不识别,通过删除所有机器hadoop.tmp.dir目录重新format解决

hadoop集群启动关闭-手动逐个进程启停

  • 每台机器上每次手动启动关闭一个角色进程
  • hdfs集群
    • hafs --daemon start namenode|datanode|decondarynamenoe
    • hafs --daemon stop namenode|datanode|decondarynamenoe
  • yarn集群
    • yarn --daemon start resourcemanager|nodemanager
    • yarn --daemon stop resourcemanager|nodemanager

shell脚本一键启停

  • 在node1上,使用软件自带的shell脚本一键启动
  • 前提:配置好机器之间的shh免密登录和workers文件
  • hdfs集群
    • start-dfs.sh
    • stop-dfs.sh
  • yarn集群
    • start-yarn.sh
    • stop-yarn.sh
  • hadoop集群
    • start-all.sh
    • stop-all.sh
      Hadoop简介以及集群搭建详细过程,# hdfs,hadoop,大数据,分布式

到了这里,关于Hadoop简介以及集群搭建详细过程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 头歌Hadoop 开发环境搭建及HDFS初体验(第2关:配置开发环境 - Hadoop安装与伪分布式集群搭建)

    注: 1 头歌《Hadoop 开发环境搭建及HDFS初体验》三关在一个实验环境下,需要三关从前往后按顺序评测,跳关或者实验环境结束后重新打开 不能单独评测通过 2 复制粘贴请用右键粘贴,CTRL+C/V不管用哦~ 第1关:配置开发环境 - JavaJDK的配置: 解压: 配置环境变量: 细节: vi

    2024年02月08日
    浏览(213)
  • Hadoop入门详解以及Hadoop集群搭建

    hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。hadoop充分利用了集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System),

    2024年02月04日
    浏览(44)
  • HDFS HA 集群搭建 - 基于Quorum Journal Manager(hadoop2.7.1)

    在Hadoop分布式文件系统(HDFS)中,检查点(Checkpointing)是一个关键的过程,它涉及到将文件系统的命名空间状态持久化到磁盘。这个状态由两部分组成:EditLogs和FsImage。 EditLogs:记录了自FsImage生成后对文件系统所做的所有修改。每次对文件系统的修改都会追加到EditLogs中。

    2024年01月16日
    浏览(46)
  • 分布式集群——搭建Hadoop环境以及相关的Hadoop介绍

    分布式集群——jdk配置与zookeeper环境搭建 分布式集群——搭建Hadoop环境以及相关的Hadoop介绍 文章目录 前言 一 hadoop的相关概念 1.1 Hadoop概念 补充:块的存储 1.2 HDFS是什么 1.3 三种节点的功能 I、NameNode节点 II、fsimage与edits文件存放的内容介绍 III、DataNode节点 IV、SecondaryNameNod

    2024年02月10日
    浏览(55)
  • Hadoop-HDFS详解与HA,完全分布式集群搭建(细到令人发指的教程)

    本篇篇幅较长,有许多集群搭建干货,和枯燥乏味但是面试可能问到的理论知识。 思来想去不知道怎样才能鼓励自己加油学习,想想要面对的生活还是假吧意思打开学习视频吧。 目录 一、引入 hdfs是什么 hdfs的由来 hdfs架构体系 hdfs的优缺点 优点 缺点 二、HDFS_block简介和注意

    2023年04月19日
    浏览(57)
  • Hadoop集群环境搭建(超详细)

    Oracle Linux 7.4 JDK 1.8 Hadoop 2.7.4 1.实验准备三台机器分别为master,slave1,slave2 2.单击master机器桌面中的konsole图标 1.编辑/etc/hosts文件,出现如下界面 [Command 001]: 2.按i键,如下图 3.第一行前面添加#,如下图 4.按键ESC,按键:wq回车,保存退出。如下图 5.切换到slave1机器,重复1~4步骤 6

    2024年02月07日
    浏览(39)
  • Hadoop集群搭建安装教程(详细完整)

    大数据 :最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,大数据究竟是什么东西?有哪些相关技术? Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理

    2024年02月08日
    浏览(71)
  • hadoop完全分布式集群搭建(超详细)-大数据集群搭建

    本次搭建完全分布式集群用到的环境有: jdk1.8.0 hadoop-2.7.7 本次搭建集群所需环境也给大家准备了,下载链接地址:https://share.weiyun.com/dk7WgaVk 密码:553ubk 本次完全分布式集群搭建需要提前建立好三台虚拟机,我分别把它们的主机名命名为:master,slave1,slave2 一.配置免密登陆 首先

    2024年02月10日
    浏览(52)
  • 基于Hadoop搭建Flink集群详细步骤

    目录 1.xftp上传flink压缩包至hadoop102的/opt/software/目录下 2.解压flink压缩包至/opt/module/目录下 3. 配置flink-conf.yaml 4.配置masters 5.配置workers 6.配置环境变量my_env.sh 7.重启环境变量 8.分发/opt/module/flink-1.13.0和/etc/profile.d/my_env.sh 9.另外两台重启环境变量 10.开启hadoop集群和flink集群 11.浏

    2024年02月09日
    浏览(69)
  • Hadoop 3.2.4 集群搭建详细图文教程

    目录 一、集群简介 二、Hadoop 集群部署方式  三、集群安装 3.1 集群角色规划  3.2 服务器基础环境准备  3.2.1 环境初始化  3.2.2 ssh 免密登录(在 hadoop01 上执行) 3.2.3 各个节点上安装 JDK 1.8 环境 3.3 安装 Hadoop 3.4 Hadoop 安装包目录结构 ​3.5 编辑 Hadoop 配置文件  3.5.1 hado

    2024年02月09日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包