【大数据】hadoop运行环境搭建(搭建如此简单)

这篇具有很好参考价值的文章主要介绍了【大数据】hadoop运行环境搭建(搭建如此简单)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

首先准备好工具。下载好最新的VMware Workstation,CentorOS 7运行Linux,建议Linux桌面标准版,且创建好一个用户


一、 模板虚拟机Hadoop100环境准备

安装模板虚拟机。IP地址192.168.150.100(自定义)、主机名称hadoop100、内存4G、硬盘50G,嘎嘎重要,一步一步来完成

1. 改为静态IP

  • vim /etc/sysconfig/network-scripts/ifcfg-ens33进入配置文件(想不起来用tab键查找)
  • 更改内容示例如下(最后的IP地址等依照自身情况做更改):

BOOTPROTO="static"

IPADDR=192.168.150.100
GATEWAY=192.168.150.2
DSN1=192.168.150.2

2. 建立主机名映射

  • Linux系统
    进入配置文件vim /etc/hosts,加上主机名及其对应IP地址
    或者
    echo "192.168.150.100 hadoop100" >> /etc/hosts
  • 再进windows系统C:\Windows\System32\drivers\etc同样修改hosts文件

如果主机名不是hadoop100可通过echo "hadoop100" > /etc/hostname来修改,reboot重启即可,如不想重启就执行hostnamectl并新开一个终端

3. 远程连接

ssh root@主机名远程连接Linux系统
下载Xshell或者finalshell或者windows终端,本文使用的是windows终端

检查网络是否连接 ping www.csdn.com

4. 安装软件包

yum install -y epel-release

Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包

5. 关闭防火墙及其开机自启

  • 关闭防火墙:systemctl stop firewalld
  • 关闭开机自启:systemctl disable firewalld.service

6. 添加root权限(后面选择root用户登录的话可以不修改)

  • root用户vim /etc/sudoers第91行加上该用户名 ALL=(ALL) NOPASSWD: ALL,由于是只读文件,退出时wq!
    或者
    将用户usermod -g wheel 该用户名 添加到wheel组中,加上NOPASSWD即可

7. 在/opt 目录下创建文件夹

  • 创建文件夹
mkdir /opt/module
mkdir /opt/software
  • 修改所有者、所属组(后面选择root用户登录的话可以不修改)
chown ygy:ygy /opt/module
chown ygy:ygy /opt/software
  • 最后 ll 查看修改情况

8. 卸载虚拟机自带的openJDK

为什么要卸载openJDK?
是因为现在很多公司都用JDK,开发项目需要统一的标准,而且对于一些一直用JDK,对openJDK不是特别了解的朋友来说,openJDK不用为好,毕竟和官网JDK稍微不太一样,难免在开发中遇到一些问题,这样会大大增加项目的不可控风险

  • 先检查虚拟机是否自带了JDK:rpm -qa | grep -i java
  • 一键删除操作:rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

解释:
rpm -qa 查询安装的所有rpm软件包
grep -i 忽略大小写
xargs -n1 表示每次只传递一个参数
rpm -e --nodeps 忽略依赖关系强制删除软件

9. 重启虚拟机

# 重启
reboot

没有改好就再改,重启到改好为止😤

二、克隆虚拟机

利用模板机hadoop100,克隆三台虚拟机Hadoop102、103、104(选择完整克隆),注意在克隆时要使hadoop100关机
hadoop环境搭建,Hadoop,大数据,hadoop,分布式,学习,笔记,开发语言

对于每一台虚拟机(按照上面的方法)

  1. 修改静态IP地址
  2. 修改主机名字
  3. 查看/etc/hosts文件内是否写入IP地址及对应的主机名
  4. reboot重启后检查主机名是否修改成功、是否ping的通(联网)
  5. 挨个远程登录试试看

三、在hadoop102上安装JDK&hadoop

以下操作在root用户下,无需安装包即可下载

1. 安装JDK

  • 进入software文件夹 cd /opt/software,执行
wget --no-check-certificate https://repo.huaweicloud.com/java/jdk/8u151-b12/jdk-8u151-linux-x64.tar.gz
  • 下载完毕后,解压下载的JDK1.8安装包 tar -zxvf jdk-8u151-linux-x64.tar.gz -C /opt/module/
  • 为了方便,重命名 mv jdk1.8.0_151/ java8
  • 配置Java环境变量,vim /etc/profile.d/my_env.sh写入
#JAVA_HOME
export JAVA_HOME=/opt/module/java8
export PATH=$PATH:$JAVA_HOME/bin
  • 刷新当前的shell环境 source /etc/profile
  • 最后查看是否成功安装java -version

2. 安装hadoop3.3.6

  • 回到/opt/software下载安装包,执行
wget --no-check-certificate https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
  • 解压 tar -zxvf hadoop-3.3.6.tar.gz -C /opt/module
  • 改名 mv hadoop-3.3.6/ hadoop
  • 配置环境变量,进入配置文件vim /etc/profile.d/my_env.sh写入
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
  • 刷新当前的shell环境 source /etc/profile
  • 最后查看是否成功安装hadoop

其中重要目录:

  1. bin 目录:存放对 Hadoop 相关服务( HDFS,YARN)进行操作的脚本
  2. etc 目录: Hadoop 的配置文件目录,存放 Hadoop 的配置文件
  3. lib 目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能)
  4. sbin 目录:存放启动或停止 Hadoop 相关服务的脚本;share 目录:存放 Hadoop 的依赖 jar 包、 文档和官方案例

总结

模板机一定要按照步骤做好准备,避免遗漏,否则一台一台改超级麻烦。

GNU Wget(常常简称为wget)是一个网络上进行下载的简单而强大的自由软件,其本身也是GNU计划的一部分。它的名字是"World Wide Web" 和 "Get"的结合,同时也隐含了软件的主要功能。目前它支持HTTP、HTTPS,月以及FTP这三个常见的的TCP/IP协议下载。

到这里,你肯定搭建好了hadoop运行环境,磨刀不误砍柴工,终于要开始学习了,下一篇将带来Hadoop的运行模式。文章来源地址https://www.toymoban.com/news/detail-717116.html

到了这里,关于【大数据】hadoop运行环境搭建(搭建如此简单)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop(伪分布式)+Spark(local模式)搭建Hadoop和Spark组合环境

    环境 使用 Ubuntu 14.04 64位 作为系统环境(Ubuntu 12.04,Ubuntu16.04 也行,32位、64位均可),请自行安装系统。 Hadoop版本 : Hadoop 2.7.4 创建hadoop用户 如果你安装 Ubuntu 的时候不是用的 \\\"hadoop\\\" 用户,那么需要增加一个名为 hadoop 的用户。 首先按 ctrl+alt+t 打开终端窗口,输入如下命令创

    2023年04月08日
    浏览(59)
  • 【hadoop】centos7.6+hadoop3.1.1搭建分布式hadoop环境——包含各类问题解决方案

    本文针对centos7.4即以上版本的hadoop环境搭建,因为这部分搭建是个很复杂且很容易出错的内容,所以在结合了多种搭建方案后给出最适宜当前版本的搭建。 本教程适用于CentOS 7.4即以上版本,如果是Ubuntu等其它linux内核版本则不适合。 查看系统版本: 软件 版本 获取方法 Ope

    2024年02月16日
    浏览(33)
  • Linux环境搭建Hadoop及完全分布式集群

    Hadoop是一个开源的分布式计算框架,旨在处理大规模数据集和进行并行计算。核心包括两个组件:HFDS、MapReduce。 配置方案 各虚拟机的用户名分别为test0、test1、test2,主机名为hadoop100、hadoop101、hadoop102 虚拟机的分配如下: hadoop100:NameNode + ResourceManager hadoop101:DataNode + NodeM

    2024年03月23日
    浏览(33)
  • 【教程】Hadoop完全分布式环境搭建全过程

    保姆级入门教程:图片讲解 + 各种问题解决方案 集群服务器:hadoop102、hadoop103和hadoop104 虚拟机版本:CentOS7-1804 资源分享处(文章最后)提供CentOS7和Hadoop各组件压缩包(也可以自行下载,要注意版本兼容的问题),有需要自取~ 1, 模板虚拟机准备 2, 克隆三台虚拟机,作为

    2024年02月06日
    浏览(41)
  • hadoop伪分布式环境搭建,完整的详细步骤

    1、VMware14 2、一台ubtuntu 18 64位 3、主机名位master 4、ip 地址:192.168.136.31 5、本次实验需要的安装包 1、 查看id 地址 2、 关闭防火墙 命令来关闭防火墙 命令查看当前防火墙状态 3、 修改主机名、 添加主机映射 修改虚拟机hosts文件,将ip地址添加进来 使用 :wq 保存 测试是否修改

    2024年02月08日
    浏览(36)
  • 【云计算平台】Hadoop全分布式模式环境搭建

    此前搭建了hadoop的单机模式与伪分布式模式: 单机模式部署 伪分布式模式部署 中间拖得有点久了,今天索性做个了结,把hadoop的全分布式模式部署的操作也简单地记录一下,算是一个系统性的学习吧。 伪分布式模式是学习阶段最常用的模式,它可以将进程都运行在同一台机

    2023年04月08日
    浏览(37)
  • Hadoop运行环境搭建

    0)安装模板虚拟机,IP 地址 192.168.10.100 、主机名称 hadoop100 、内存 4G 、硬盘 50G 1)hadoop100 虚拟机配置要求如下 1.使用 yum 安装需要虚拟机可以正常上网,yum 安装前可以先测试下虚拟机联网情 况

    2024年02月13日
    浏览(38)
  • Hadoop——Hive运行环境搭建

    Windows:10         JDK:1.8         Apache Hadoop:2.7.0 Apache Hive:2.1.1         Apache Hive src:1.2.2         MySQL:5.7 1、下载 Hadoop搭建 Apache Hive 2.1.1:https://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz Apache Hive 1.2.2 src:https://archive.apache.org/dist/hive/hive-1.2.2/apache-hive-1.

    2024年02月16日
    浏览(28)
  • Hadoop 运行环境搭建(开发重点)

    将 hadoop 的安装包和 jdk 的安装包,上传到 hadoop102 的 /opt/software 目录下 输入命令: tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/ 将jdk压缩包解压到 /opt 目录下 输入命令: mv jdk1.8.0_212/ jdk1.8 包的名字太长了我们给他改成 jdk1.8 然后接下来,配置jdk的环境变量 输入命令: vim /etc/profile 添

    2024年02月07日
    浏览(32)
  • 虚拟机上搭建Hadoop运行环境

    下载并安装VMware,这里不做赘述,具体步骤可自行百度。 本篇文章使用的VMware15版本演示,其他版本步骤同理。 2.1硬件部分 注意:这里不能超过自己电脑内核总数 打开任务管理器(快捷键 ctrl + alt +del),查看电脑内核总数: 查看到我电脑是有8个CPU内核 假如我们未来要克隆

    2024年02月04日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包