大数据技术之Hadoop-运行环境搭建

这篇具有很好参考价值的文章主要介绍了大数据技术之Hadoop-运行环境搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Hadoop 运行环境搭建

 一、VMware准备Linux虚拟机 

 1. 设置VMware网段

 VMware的虚拟网络编辑器中,将VMnet8虚拟网卡的:

  • 网段设置为:192.168.88.0
  • 网关设置为:192.168.88.2

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

 2. 下载CentOS操作系统

首先,我们需要下载操作系统的安装文件,本次使用CentOS7.6版本进行学习:

https://vault.centos.org/7.6.1810/isos/x86_64/   

首先,我们需要下载操作系统的安装文件,本次使用CentOS7.6版本进行学习: 

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

 或者直接使用如下链接下载:

https://vault.centos.org/7.6.1810/isos/x86_64/CentOS-7-x86_64-DVD-1810.iso

3. 在VMware中安装CentOS操作系统

打开VMware软件

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

按照步骤创建虚拟机:

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

点击完成后,即开启了CentOS系统的安装,耐心等待安装完成即可,后续都是自动化的。

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

点击用户名:

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器 大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

体验Linux的快乐吧。

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

4. 配置多台Linux虚拟机

我们可以使用VMware提供的克隆功能,基于一台虚拟机去克隆创建多台虚拟机。

首先VMware中,创建一个文件夹,起名为大数据集群

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

克隆

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

同样的操作克隆出:node2和node3

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

对虚拟机的内存进行配置:

  • node1配置为4G内存
  • node2node3配置为2G内存

二 、VMware虚拟机系统设置

1. 对三台虚拟机完成主机名、固定IP、SSH免密登陆等系统设置

1. 1 配置固定IP地址

开启node1,修改主机名为node1,并修改固定ip为:192.168.88.131

#修改主机名
hostnamectl set-hostname node1

#修改IP地址
vim /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR="192.168.88.131"

#重启网卡
systemctl stop network
systemctl start network#

#或者直接
systemctl restart network

同样的操作启动node2和node3,

修改node2主机名为node2,设置ip为192.168.88.132

修改node2主机名为node3,设置ip为192.168.88.133

1.2 配置主机名映射

在Windows系统中修改hosts文件,填入如下内容:

192.168.88.131 node1
192.168.88.132 node2
192.168.88.133 node3

在3台Linux的/etc/hosts文件中,填入如下内容(3台都要添加)

192.168.88.131 node1
192.168.88.132 node2
192.168.88.133 node3
 1.3 配置SSH免密登录

后续安装的集群化软件,多数需要远程登录以及远程执行命令,我们可以简单起见,配置三台Linux服务器之间的免密码互相SSH登陆

        在每一台机器都执行:`ssh-keygen -t rsa -b 4096`,一路回车到底即可。

        在每一台机器都执行:

ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3

        执行完毕后,node1、node2、node3之间将完成root用户之间的免密互通

1.4 创建hadoop用户并配置免密登录

后续大数据的软件,将不会以root用户启动(确保安全,养成良好的习惯)

我们为大数据的软件创建一个单独的用户hadoop,并为三台服务器同样配置hadoop用户的免密互通

        1. 在每一台机器执行:useradd hadoop,创建hadoop用户

        2. 在每一台机器执行:passwd hadoop,设置hadoop用户密码为123456

        3. 在每一台机器均切换到hadoop用户:su - hadoop,并执行 ssh-keygen -t rsa -b 4096,创建ssh密钥

       4 在每一台机器均执行

ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3

2. JDK环境部署 

2.1 什么是JDK为什么需要部署它

        JDKJava Development Kit,是用于Java语言开发的环境。

        大数据的很多软件的运行都需要有Java运行环境的支持,所以我们在三台服务器上,预先都部署好JDK环境。

2.2 配置JDK环境

        下载JDK软件:https://www.oracle.com/java/technologies/downloads

在页面下方找到:

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

下载jdk-8u361-linux-x64.tar.gz

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器

1.创建文件夹,用来部署JDK,将JDK和Tomcat都安装部署到:/export/server 内

mkdir -p /export/server

2. 解压缩JDK安装文件

tar -zxvf jdk-8u351-linux-x64.tar.gz-C /export/server

3. 配置JDK的软链接

ln-s /export/server/jdk1.8.0_351 /export/server/jdk

 4. 配置JAVA_HOME环境变量,以及将$JAVA_HOME/bin文件夹加入PATH环境变量中

# 编辑/etc/profile文件
export JAVA_HOME=/export/server/jdk
export PATH=$PATH:$JAVA_HOME/bin

5. 生效环境变量

source /etc/profile

 6. 配置java执行程序的软链接

# 删除系统自带的java程序
rm -f /usr/bin/java
# 软链接我们自己安装的java程序
Ln-s /export/server/idk/bin/java /usr/bin/java

7. 执行验证

java -version
javac -version

3. 防火墙、SELinux、时间同步

关闭防火墙和SELinux

集群化软件之间需要通过端口互相通讯,为了避免出现网络不通的问题,我们可以简单的在集群内部关闭防火墙。

# 每台机器执行
systemctl stop firewalld
systemctl disable firewalld

Linux有一个安全模块:SELinux,用以限制用户和程序的相关权限,来确保系统的安全稳定。

在当前,我们只需要关闭SELinux功能,避免导致后面的软件运行出现问题即可

# 每台机器执行
vim /etc/sysconfig/selinux

#将第七行,SELINUX=enforcing 改为
SELINUX=disabled
#保存退出后,重启虚拟机即可,千万要注意disabled单词不要写错,不然无法启动系统

4. 修改时区并配置自动时间同步 

以下操作在三台Linux均执行

1. 安装ntp软件

yum install -y ntp

 2. 更新时区

rm -f /etc/localtime;sudo ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

3. 同步时间

ntpdate -u ntp.aliyun.com

4. 开启ntp服务并设置开机自启

systemctl start ntpd
systemctl enable ntpd

5. 设置快照 

目前Linux虚拟机的状态基本准备就绪,可以对当前状态进行快照保存,以备后续恢复。

对三台虚拟机均执行拍摄快照。

大数据技术之Hadoop-运行环境搭建,Hadoop,linux,运维,服务器文章来源地址https://www.toymoban.com/news/detail-838212.html

到了这里,关于大数据技术之Hadoop-运行环境搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop运行环境搭建

    0)安装模板虚拟机,IP 地址 192.168.10.100 、主机名称 hadoop100 、内存 4G 、硬盘 50G 1)hadoop100 虚拟机配置要求如下 1.使用 yum 安装需要虚拟机可以正常上网,yum 安装前可以先测试下虚拟机联网情 况

    2024年02月13日
    浏览(38)
  • Hadoop——Hive运行环境搭建

    Windows:10         JDK:1.8         Apache Hadoop:2.7.0 Apache Hive:2.1.1         Apache Hive src:1.2.2         MySQL:5.7 1、下载 Hadoop搭建 Apache Hive 2.1.1:https://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz Apache Hive 1.2.2 src:https://archive.apache.org/dist/hive/hive-1.2.2/apache-hive-1.

    2024年02月16日
    浏览(28)
  • Hadoop 运行环境搭建(开发重点)

    将 hadoop 的安装包和 jdk 的安装包,上传到 hadoop102 的 /opt/software 目录下 输入命令: tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/ 将jdk压缩包解压到 /opt 目录下 输入命令: mv jdk1.8.0_212/ jdk1.8 包的名字太长了我们给他改成 jdk1.8 然后接下来,配置jdk的环境变量 输入命令: vim /etc/profile 添

    2024年02月07日
    浏览(32)
  • 虚拟机上搭建Hadoop运行环境

    下载并安装VMware,这里不做赘述,具体步骤可自行百度。 本篇文章使用的VMware15版本演示,其他版本步骤同理。 2.1硬件部分 注意:这里不能超过自己电脑内核总数 打开任务管理器(快捷键 ctrl + alt +del),查看电脑内核总数: 查看到我电脑是有8个CPU内核 假如我们未来要克隆

    2024年02月04日
    浏览(50)
  • Linux CentOS下大数据环境搭建(zookeeper+hadoop+hbase+spark+scala)

    本篇文章是结合我个人学习经历所写,如果遇到什么问题或者我有什么错误,欢迎讨论。 百度网盘链接:https://pan.baidu.com/s/1DCkQQVYqYHYtPws9hWGpgw?pwd=zh1y 提取码:zh1y 软件在连接中VMwareWorkstation_V16.2.1_XiTongZhiJia的文件夹下。 双击运行安装包,这里下一步即可。 这里勾选我接受许可

    2024年04月15日
    浏览(53)
  • Linux服务器集群-大数据基础环境搭建指南

    本文将构建三台Linux服务器(node1、node2、node3),通过相关配置,搭建出一个Linux服务器集群环境适用于大数据的开发学习。 本文使用的VMware版本为:VMware16; 本文环境搭建使用到的Linux发行版本为:CentOS7; 本文的电脑操作环境为:windows11。 首先,需要根据之前发文中的流程

    2024年02月07日
    浏览(45)
  • vm安装,虚拟环境搭建win+linux+mac,及本机连接虚拟环境数据库、windows服务器搭建、内网穿透

    教程中的软件、镜像、工具可去阿里云盘提取: 阿里云盘:https://www.aliyundrive.com/s/CLdTjFtnYbr 提取码:s1a8 一、安装虚拟机 下载链接:https://www.vmware.com/products/workstation-pro.html 下载的过程中可能需要注册登录 下载vm 后双击安装即可 vm安装成功后,需要激活 二、安装windows虚拟机

    2024年02月08日
    浏览(48)
  • 大数据平台运维(hadoop入门(保姆篇))----概述及基本环境配置(HA-1)

    2022.12.4  大数据运维基础篇 本章主要是基础坏境配置 目录 前言  一、hadoop是什么? 1.1 Hadoop 是什么 1.2 Hadoop 优势 1.3 Hadoop 组成  二、大数据技术体系                   2.1 HDFS 架构概述Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 2.2 YARN 架构概述 2.3 MapRed

    2024年02月08日
    浏览(39)
  • 【大数据】Hadoop运行模式(集群搭建)

    Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 本地模式(Local/Standalone Mode):单台服务器,数据存储在Linux本地。生产环境几乎不会采用该模式 伪分布式模式(Pseudo-Distributed Mode):单台服务器,数据存储在HDFS上。有较少的小型公司采用该模式。 完全

    2024年02月03日
    浏览(28)
  • Linux环境搭建Hadoop及完全分布式集群

    Hadoop是一个开源的分布式计算框架,旨在处理大规模数据集和进行并行计算。核心包括两个组件:HFDS、MapReduce。 配置方案 各虚拟机的用户名分别为test0、test1、test2,主机名为hadoop100、hadoop101、hadoop102 虚拟机的分配如下: hadoop100:NameNode + ResourceManager hadoop101:DataNode + NodeM

    2024年03月23日
    浏览(33)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包