【大数据】Hadoop运行环境搭建

这篇具有很好参考价值的文章主要介绍了【大数据】Hadoop运行环境搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、模板虚拟机环境准备

使用VMware虚拟机搭建基于CentOS7的Hadoop环境:

  • cpu核数(需要搭建3台Hadoop组成集群,加上Windows本机,所以可以分配的数量为本机的cpu核数除以4)
  • 内存至少4G
  • 硬盘最少50G

1. 创建虚拟机

创建虚拟机:

  • 新建虚拟机,选择自定义(高级)—>硬件兼容性默认—>选择稍后安装操作系统 —>客户机操作系统选择 Linux、CentOS7 64位
  • 配置虚拟机名称、存储位置
  • 处理器数量2,每个处理器内核数2(本机总共有8核,16个逻辑处理器)—>配置虚拟机内存4G
  • 网络类型默认的NAT—>IO类型、磁盘类型默认
  • 选择创建新虚拟磁盘—>磁盘容量设置为50G,默认将虚拟磁盘拆分成多个文件不用变—>- 创建的磁盘文件配置到指定目录
  • 完成

安装CentOS7系统:

  • 配置CD/DVD使用的iso文件指向下载好的 CentOS 7系统镜像
  • 启动虚拟机—>选择安装CentOS7 虚拟机
  • 自动进入图形界面安装—>选择中文(安装过程中使用的语言,不代表操作系统的语言),继续—>修改时区、日期和时间—>软件选择可以选择最小安装或者GNOME桌面安装,本次选择桌面版
  • 选择安装位置,我要分配分区进行手动分区,大小可以参考以下配置: /boot:1g(如果是最小化安装,/boot只有150多Mb),文件系统配置为 ext4 swap分区:4g
    /:剩余空间分给根分区,文件系统默认xfr就行
  • 自己实验用的虚拟机,KDUMP可以禁用kdump以节省资源。(kdump是系统崩溃前捕获系统信息,用于诊断崩溃原因,但是需要预留一部分系统内存)
  • 网络和主机名称配置主机名称、网络,主机名设置为hadoop100—>SECURITY POLICY安全策略默认打开即可
  • 点击安装—>安装的过程中可以配置root密码—>等安装完成,点击重启—>重启进来之后,点开许可协议,选择我同意许可协议—>点击完成配置
  • 选择中文、汉语、打开位置、选择上海时区、跳过在线账号—>创建一个普通用户
  • 完成

详细步骤可点击—>尚硅谷大数据Hadoop教程

2. 配置网络静态IP

  • 配置hostname,检查vim /etc/hostname中的主机名配置信息,例如将主机名配置为hadoop100(后面的几台集群中主机为hadoop101、hadoop102、hadoop103组成集群)

  • 配置IP为静态IP,vim /etc/sysconfig/network-scripts/ifcfg-ens33进入配置文件,修改内容为:

# 将DHCP动态获取修改为static静态IP,其他保持默认
BOOTPROTO="static"
# 然后添加以下配置(根据虚拟机实际情况进行配置)
# ip地址
IPADDR=192.168.103.100
# 网关(可以在VMware虚拟网络编辑器的NAT模式中 NAT设置里面查找到)
GATEWAY=192.168.103.2
# 域名解析器
DNS1=192.168.103.2

3. 配置host映射文件

  • 配置hosts映射,,将集群中的主机添加进来,vim /etc/hosts进入配置文件添加如下内容:
192.168.103.100 hadoop100
192.168.103.101 hadoop101
192.168.103.102 hadoop102
192.168.103.103 hadoop103
192.168.103.104 hadoop104
  • 在Windows系统中,也将Hosts映射加入进来,进入C:\Windows\System32\drivers\etc\hosts文件增加同样的内容。
  • 配置好网络,使用reboot重启使其生效
  • 重新进来后,使用ifconfig判断网络配置是否生效,ping一个外部网站查看是否可以连网

4. 安装epel-release

Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数 rpm 包在官方 repository中是找不到的。

安装命令

yum install -y epel-release

如果Linux安装的是最小系统板,还需要安装net-tool、vim等常用工具:

# 安装ifconfig命令
yum install -y net-tools
# 安装vim编辑器
yum install -y vim

5. 关闭防火墙及防火墙的开机自启

# 关闭防火墙
systemctl stop firewalld
# 关闭防火墙的开机自启
systemctl disable firewalld.service

6. 用户添加root权限

如果安装的桌面版,在安装过程就会让创建一个非root用户。
如果安装的最小系统版,则可以手工执行命令创建一个非root用户:

useradd huahua
passwd huahua

将该用户加入sudoers中,方便后续添加sudo执行命令。

编辑/etc/sudoers文件(该文件默认只读,需要先添加写权限),在%wheel用户执行命令权限下面添加一行:

%wheel  ALL=(ALL)       ALL
# 在%wheel下面添加,不要直接加载 root下面。因为所有用户都属于wheel组,如果放到了root下面(%wheel上面),那么执行了NOPASSWD:ALL免密之后,程序走到%wheel时就又会被覆盖回需要密码
huahua ALL=(ALL) NOPASSWD:ALL

7. 创建文件夹

在/opt下创建文件夹module、software:

mkdir /opt/module

mkdir /opt/software 修改 module、software 文件夹的所有者和所属组

chown huahua:huahua /opt/module 
chown huahua:huahua /opt/software

8. 卸载虚拟机自带的JDK

注意:如果虚拟机是最小化安装不需要执行这一步。

检查系统中自带的JDK:

rpm -qa | grep -i java

卸载自带的JDK(需要以root用户运行):

rpm -qa | grep -i java | grep -v ".noarch" | xargs -n1 rpm -e  --nodeps
  • grep -i 忽略大小写
  • xargs 将前面的输出结果作为命令的参数
  • -n1 每次只取一个结果作为命令参数。如果不加,则会将所有结果以空格分隔拼接作为命令的参数
  • rpm -e --nodeps 不验证套件档的相互关联性进行卸载

9. 重启虚拟机

# 重启虚拟机
reboot 

二、克隆虚拟机

  • 因为我们要搭建集群,所以需要再克隆出几台虚拟机出来。
  • 将hadoop100虚拟机关机,然后创建完整克隆。克隆出 hadoop102、hadoop103、hadoop104几台主机。(hadop101用于后面搭建伪分布式,分析源码,本次先不搭建进集群中)。
  • 克隆完成之后,还需要依次修改 hadoop102、hadoop103、hadoop104的ip和hostname。

1. 修改克隆机IP

  • 修改克隆虚拟机的静态IP(以hadoop102为例)
    vim /etc/sysconfig/network-scripts/ifcfg-ens33进入配置文件,修改
BOOTPROTO=static
···
IPADDR=192.168.103.102
GATEWAY=192.168.103.2
DNS1=192.168.103.2
  • 查看 Linux 虚拟机的虚拟网络编辑器,编辑—>虚拟网络编辑器—>VMnet8
  • 查看 Windows 系统适配器 VMware Network Adapter VMnet8 的 IP 地址
  • 保证 Linux 系统 ifcfg-ens33 文件中 IP 地址、虚拟网络编辑器地址和 Windows 系统 VM8 网络 IP 地址相同

2. 修改克隆机主机名

  • 修改主机名称(以hadoop102为例),vim /etc/hostname进入配置文件,主机名改为hadoop102
  • 配置 Linux 克隆机主机名称映射 hosts 文件,vim /etc/hosts打开/etc/hosts
    添加如下内容:
192.168.103.100 hadoop100
192.168.103.101 hadoop101
192.168.103.102 hadoop102
192.168.103.103 hadoop103
192.168.103.104 hadoop104
  • 配置好网络,使用reboot重启使其生效
  • 在Windows系统中,也将Hosts映射加入进来,进入C:\Windows\System32\drivers\etc\hosts文件增加同样的内容。

三、环境搭建

JDK、Hadoop都先在 hadoop102 服务器上安装,安装好之后再 scp 复制到其他服务器。

1. 安装JDK

  • 将 jdk1.8 压缩包上传到创建的 /opt/software 文件夹中。
  • 将 jdk 解压到创建的 /opt/module/ 文件夹中:
tar -zxvf jdk-8u361-linux-x64.tar.gz -C /opt/module/
  • 配置环境变量,可以直接在 /etc/profile.d文件夹中创建一个.sh后缀的文件,/etc/profile会遍历该文件夹下的所有.sh文件的内容作为环境变量。
    /etc/profile.d下创建 my_env.sh
# JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_361
export PATH=$PATH:$JAVA_HOME/bin
  • 重新加载环境变量:
source /etc/profile
  • 测试 JDK 是否安装成功
java -version
# 如果能看到以下结果,则代表 Java 安装成功
java version "1.8.0_361"

2. 安装Hadoop

  • 从官网(或国内镜像站)下载Hadoop 3.x安装包。
  • 将安装包上传到创建的/opt/software文件夹中
  • 解压:
tar -zxvf hadoop-3.3.6.tar.gz -C /opt/module/
  • 配置环境变量(hadoop需要配置 /bin和 /sbin两个目录到环境变量)。
    同样的,我们在 /etc/profile.d/my_env.sh中进行添加:
# HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.3.6
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
  • 刷新环境变量,查询Hadoop版本进行验证:
# 刷新环境变量
source /etc/profile
# 验证
hadoop version

Hadoop重要目录文章来源地址https://www.toymoban.com/news/detail-720638.html

  • bin 目录:存放对 Hadoop 相关服务(hdfs,yarn,mapred)进行操作的脚本
  • etc 目录:Hadoop 的配置文件目录,存放 Hadoop 的配置文件
  • lib 目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能)
  • sbin 目录:存放启动或停止 Hadoop 相关服务的脚本
  • share 目录:存放 Hadoop 的依赖 jar 包、文档、和官方案例

到了这里,关于【大数据】Hadoop运行环境搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop运行环境搭建

    0)安装模板虚拟机,IP 地址 192.168.10.100 、主机名称 hadoop100 、内存 4G 、硬盘 50G 1)hadoop100 虚拟机配置要求如下 1.使用 yum 安装需要虚拟机可以正常上网,yum 安装前可以先测试下虚拟机联网情 况

    2024年02月13日
    浏览(54)
  • Hadoop——Hive运行环境搭建

    Windows:10         JDK:1.8         Apache Hadoop:2.7.0 Apache Hive:2.1.1         Apache Hive src:1.2.2         MySQL:5.7 1、下载 Hadoop搭建 Apache Hive 2.1.1:https://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz Apache Hive 1.2.2 src:https://archive.apache.org/dist/hive/hive-1.2.2/apache-hive-1.

    2024年02月16日
    浏览(37)
  • Hadoop 运行环境搭建(开发重点)

    将 hadoop 的安装包和 jdk 的安装包,上传到 hadoop102 的 /opt/software 目录下 输入命令: tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/ 将jdk压缩包解压到 /opt 目录下 输入命令: mv jdk1.8.0_212/ jdk1.8 包的名字太长了我们给他改成 jdk1.8 然后接下来,配置jdk的环境变量 输入命令: vim /etc/profile 添

    2024年02月07日
    浏览(43)
  • 【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )

    Hadoop 发布版本在 https://hadoop.apache.org/releases.html 页面可下载 ; 当前最新版本是 3.3.6 , 点击 Binary download 下的 binary (checksum signature) 链接 , 进入到 Hadoop 3.3.6 下载页面 : 下载地址为 : https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz 官方下载速度很慢 ; 这里提供一个 Hadoop 版

    2024年02月13日
    浏览(71)
  • linux安装JDK及hadoop运行环境搭建

    1.linux中安装jdk (1)下载JDK至opt/install目录下,opt下创建目录soft,并解压至当前目录 tar xvf ./jdk-8u321-linux-x64.tar.gz -C /opt/soft/ (2)改名 (3)配置环境变量:vim /etc/profile #JAVA_HOME export JAVA_HOME=/opt/soft/jdk180 export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export PATH=$PATH:$JAVA_HOM

    2024年02月11日
    浏览(44)
  • Hadoop集群环境配置搭建

    Hadoop最早诞生于Cutting于1998年左右开发的一个全文文本搜索引擎 Lucene,这个搜索引擎在2001年成为Apache基金会的一个子项目,也是 ElasticSearch等重要搜索引擎的底层基础。 项目官方:https://hadoop.apache.org/ 首先准备三台Linux服务器,预装CentOS7。三台服务器之间需要网络互通。本地

    2024年02月03日
    浏览(37)
  • 【大数据】Hadoop运行模式(集群搭建)

    Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 本地模式(Local/Standalone Mode):单台服务器,数据存储在Linux本地。生产环境几乎不会采用该模式 伪分布式模式(Pseudo-Distributed Mode):单台服务器,数据存储在HDFS上。有较少的小型公司采用该模式。 完全

    2024年02月03日
    浏览(37)
  • 头歌Hadoop 开发环境搭建及HDFS初体验(第2关:配置开发环境 - Hadoop安装与伪分布式集群搭建)

    注: 1 头歌《Hadoop 开发环境搭建及HDFS初体验》三关在一个实验环境下,需要三关从前往后按顺序评测,跳关或者实验环境结束后重新打开 不能单独评测通过 2 复制粘贴请用右键粘贴,CTRL+C/V不管用哦~ 第1关:配置开发环境 - JavaJDK的配置: 解压: 配置环境变量: 细节: vi

    2024年02月08日
    浏览(212)
  • hadoop win11安装hadoop环境 winutils.exe获取,windows安装大数据运行环境 winutils文件获取,winutils文件 hadoop(十四)

    注:有些win环境的大数据dll文件,winutils.exe需要积分下载,我没有积分,提供一份github链接 每个版本基本都有,挺全。 1. github地址: GitHub - cdarlint/winutils: winutils.exe hadoop.dll and hdfs.dll binaries for hadoop windows 2. 从上述链接,下载工程,复制出来自己的版本,我hadoop安装的3.3.4,

    2024年02月04日
    浏览(61)
  • 大数据开发·关于虚拟机Hadoop完全分布式集群搭建教程

    官网链接 进入后网站如图,各位按需下载 官网链接 进入页面点击下载 再根据我们需要下载的软件进入下载页面 点击右侧红框内的免费授权页面获取免费许可 进入后如图,两者我们都需要所以都勾选,填写的邮箱用于接收下载链接,下载后进行安装即可 这里先和大家强调一

    2024年02月07日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包