ubuntu服务器版本搭建Hadoop集群

这篇具有很好参考价值的文章主要介绍了ubuntu服务器版本搭建Hadoop集群。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

实验环境:
虚拟化软件:VMware® Workstation 16 Pro
镜像:ubuntu-22.04.2-live-server-amd64.iso
Hadoop版本:hadoop-3.3.4.tar.gz
ubuntu镜像链接
hadoop文件链接

  1. 配置虚拟机
    (1)新建虚拟机,选择实验镜像【ubuntu-22.04.2-live-server-amd64.iso】
    (2)调整硬件配置,配置如图
    ubuntu安装hadoop集群,服务器,ubuntu,hadoop

  2. 安装操作系统
    (1)选择虚拟机语言,键盘布局
    语言:English
    键盘布局:美式键盘(ANSI)布局
    (2)选择安装类型
    保持默认选择 Ubuntu Server,选择 Done 继续
    (3)网络配置
    在 NAT 模式下,默认采用 DHCP 方式为虚拟机动态分配 IP 地址,我们需要让虚拟机主动“认领”属于自己的静态 IP 地址。
    1)记录当前ip地址:192.168.110.142/24
    ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 1 原始IP地址

记录当前ip地址是为了确定网络前缀,如本机的网络前缀为192.168.110,方便后续配置子网掩码和网关。
2)设置网络
·使用方向键选中图1所示界面的 [ens33 eth - ▶︎],回车进入子菜单
·选择 Edit IPv4
·选择 Automatic (DHCP)
·选择 Manual
·填写所有字段,保持 IPv4 地址前三段不变:

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 2 配置namenode网络
·选择 Save 保存设置

·等待屏幕底部 Applying changes 动画消失后,选择 Done 完成网络配置
3)代理服务器设置
代理服务器在使用企业网络时通常有用,本实验不需要,直接选择 Done 继续实验。
4)镜像源配置,使用中国科学技术大学的开源软件镜像源,填入以下地址:

http://mirrors.ustc.edu.cn/ubuntu

(4)磁盘格式化
1)进入硬盘格式化页面,使用方向键移动到【 [ ] Set up this disk as an LVM group 】上,按回车键取消勾选,随后继续至下一页。
2)检查格式化配置

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 3 检查硬盘格式化配置
(5)用户配置 设置管理员用户名supper,密码1234,主机名称namenode

(6)其他配置
1)是否升级到Ubuntu Pro
不需要 Ubuntu Pro 的功能,选择 Skip for now.
2)在新的页面,选择 【[ ] Install OpenSSH server】,按回车键勾选
3)下一个页面会询问我们是否需要一些主流环境。按下 Tab 键,选择 Done.
(7)系统安装
等待系统安装完成,系统安装完后重启

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 4 ubuntu系统安装完成

(8)登陆到系统

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 5 使用supper用户进入系统
  1. 安装hadoop
    (1)创建hadoop用户,并设置密码
    【sudo adduser hadoop】

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 6 创建hadoop用户
(2)创建 Hadoop 安装目录 【sudo mkdir /usr/local/hadoop】

(3)将本机的hadoop-3.3.4.tar.gz移入虚拟机
1)打开cmd,输入命令:
【scp hadoop-3.3.4.tar.gz super@192.168.178.100:/tmp】
2)将安装包移入创建的hadoop安装目录中
【sudo mv /tmp/hadoop-3.3.4.tar.gz /usr/local/hadoop】

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 7 将hadoop-3.3.4.tar.gz移入虚拟机
3)前往hadoop目录 【cd /usr/local/hadoop】

4)解压压缩包
【sudo tar -zxf hadoop-3.3.4.tar.gz】
5)将压缩包内容移入上一级目录,并将文件夹【hadoop-3.3.4】删除
【sudo mv hadoop-3.3.4/* .】
【sudo rm -r hadoop-3.3.4】
6)赋予用户hadoop读取hadoop文件夹的权限
【sudo chown -R hadoop:hadoop .】
(4)修改profile
【sudo nano /etc/profile.d/hadoop.sh】
添加以下内容

#HADOOP_HOME
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 8 修改profile
(5)应用变更 【source /etc/profile】
  1. 安装Java
    (1)安装 OpenJDK 包
    【sudo apt -y install openjdk-8-jdk】
    (2)修改 Hadoop 运行环境配置
    【sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh】
    修改JAVA_HOME环境变量,如图

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 9 修改JAVA_HOME环境变量
  1. Hadoop配置
    (1)切换到hadoop用户
    【su - hadoop】
    (2)进入hadoop目录
    【cd $HADOOP_HOME/etc/hadoop】
    (3)修改配置文件
    1)core-site.xml文件
    执行【nano core-site.xml】,在【】块内填写以下信息
<configuration>
  <!-- Namenode address -->
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://namenode:8020</value>
  </property>

  <!-- Hadoop data location -->
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop/data</value>
  </property>

  <!-- Static user - no login needed -->
  <property>
    <name>hadoop.http.staticuser.user</name>
    <value>hadoop</value>
  </property>
</configuration>

2)hdfs-site.xml文件
执行【nano hdfs-site.xml】,在【】块内填写以下信息

<configuration>
  <property>
    <name>dfs.namenode.http-address</name>
    <value>namenode:9870</value>
  </property>
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>datanode2:9868</value>
  </property>
</configuration>

3)yarn-site.xml文件
执行【nano yarn-site.xml】,在【】块内填写以下信息

<configuration>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>datanode1</value>
  </property>
  <property>
    <name>yarn.nodemanager.env-whitelist</name>
    <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
  </property>
</configuration>

4)mapred-site.xml文件
执行【nano mapred-site.xml】,在【】块内填写以下信息

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

(4)修改workers文件
【nano workers】
移除【localhost】
添加以下内容

namenode
datanode1
datanode2

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 10 修改workers
(5)配置网络

1)登录supper用户,修改hosts文件
【sudo nano /etc/hosts】
2)在hosts文件中添加以下两行

192.168.178.101 datanode1
192.168.178.102 datanode2

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 11 修改hosts文件
(6)关机

(7)克隆虚拟机
克隆namenode为datanode1和datanode2
1)datanode1开机,登录到supper用户
2)修改主机名为datanode1
【sudo hostnamectl set-hostname datanode1】
3)修改IP设置
【sudo nano /etc/netplan/00-installer-config.yaml】
将【addresses:】下的192.168.110.100修改为datanode1的IP地址192.168.110.101
4)重启虚拟机
【sudo reboot】
5)登录到supper用户,输入命令验证IP是否修改
【ip addr】

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 12 查看datanode1修改后的IP地址
同理,修改datanode2的主机名为datanode2,修改datanode2的IP为192.168.110.102

(8)同时运行三台虚拟机,并登陆到hadooop用户
(9)三台主机执行命令生成密钥对
【ssh-keygen -t ed25519】
(10)三台主机各自执行命令
【ssh-copy-id namenode】
【ssh-copy-id datanode1】
【ssh-copy-id datanode2】

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 13 namenode结点生成密钥
5. 启动集群

(1)在namenode结点上用hadoop用户登录并格式化HDFS,启动集群
【hdfs namenode -format】
【start-dfs.sh】
(2)在datanode1结点用hadoop用户登录,启动yarn
【start-dfs.sh】
7. Hadoop搭建完成
(1)HDFS控制面板
在浏览器输入进入如下网址hdfs控制面板
【http://192.168.110.100:9870】
注意192.168.110.100是我的namenode节点的IP地址

ubuntu安装hadoop集群,服务器,ubuntu,hadoop

图 14 HDFS控制面板
(2)YARN控制面板 在浏览器输入进入如下网址yarn控制面板 【http://192.168.110.101:8088】

ubuntu安装hadoop集群,服务器,ubuntu,hadoop文章来源地址https://www.toymoban.com/news/detail-716213.html

图 15 YARN控制面板
(3)Hadoop集群部署成功!

到了这里,关于ubuntu服务器版本搭建Hadoop集群的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Ubuntu搭建原神3.5版本服务器

    本文涉及知识点 linux基础命令|mongoDB服务端搭建及指令|Java环境搭建 为了学习以上提到的技术,本文只以元神私服做LINUX MongoDB java教学例子 关于有部分读者反馈3.6下载地址打不开的问题,因为下载地址是GitHub的。如果你只是原神玩家,而发现打不开GitHub的话,可以参照我这篇

    2023年04月09日
    浏览(48)
  • 三台异构服务器搭建hadoop HA集群史上最详细方案(HDFS+YARN)

     一、系统基础服务配置 主机名 IP 操作系统 CPU 内存 磁盘 Hive01 10.86.102.104 Centos 7.9.2009 Xeon 4208 X16 192G 46T Hive02 10.86.102.102 Centos 7.9.2009 Xeon 4208 X16 192G 46T Hive03 10.86.102.105 Centos 7.9.2009 Xeon 8260 X48 256G         11T 最终组成的是一个双副本56T的集群,设置YARN内存共400GB(可调) 3台服务

    2024年02月07日
    浏览(56)
  • Ubuntu搭建原神3.7版本服务器(含3.5-3.7服务端)

    本文涉及知识点 linux基础命令|mongoDB服务端搭建及指令|Java环境搭建 为了学习以上提到的技术,本文只以元神私服做LINUX MongoDB java教学例子 关于有部分读者反馈3.6下载地址打不开的问题,因为下载地址是GitHub的。如果你只是原神玩家,而发现打不开GitHub的话,可以参照我这篇

    2024年02月06日
    浏览(48)
  • Ubuntu20.04操作系统安装-裸机安装服务器版本

    下载Ubuntu系统 Ubuntu 官网下载 https://releases.ubuntu.com/focal/ 下载服务器版本镜像 准备启动U盘 下载UltraISO软件,选择 文件 - 打开,打开刚才下载的Ubuntu镜像 选择 启动 - 写入硬盘映象 插入一个U盘,选择插入的U盘刻录启动U盘,注意,此操作会格式化U盘的所有数据! 安装Ubuntu系统

    2024年02月05日
    浏览(52)
  • Ubuntu最新版本(Ubuntu22.04LTS)安装nfs服务器

    NFS(Network File System)是一种允许不同计算机之间共享文件的网络文件系统。 在Ubuntu 22.04 LTS中,您可以使用以下步骤安装并配置NFS服务器。 一、安装NFS服务器 在Ubuntu 22.04 LTS中,您可以使用以下命令安装NFS服务器: 二、创建共享目录 接下来,您需要创建要共享的目录。在本

    2024年02月05日
    浏览(63)
  • 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程

    elasticsearch安装教程大全 elasticsearch学习笔记(一) elasticsearch学习笔记(二) elasticsearch学习笔记(三) 可参考:Debian安装docker Centos安装docker (docker-compose可以直接互连) 因为我们还需要部署kibana容器,因此需要让es和kibana容器互联。这里先创建一个网络: Elasticsearch 和 kibana 版

    2023年04月08日
    浏览(44)
  • 【超简易安装】在linux集群服务器上使用conda安装高版本cuda(cuda-11.8)和pytorch2.0

    由于项目代码要求pytorch2.0版本,而pytorch2.0版本需要cuda11.8,高于我之前的11.0的cuda版本。 因此考虑使用conda新建一个虚拟环境,在里面使用高版本的cuda和pytorch。 我使用的是lunix多人集群服务器。集群服务器需要用作业调度系统,也就是bsub命令之后才能提交作业,运行任务。

    2024年03月17日
    浏览(68)
  • 【Linux】 ubuntu 安装搭建Samba cifs服务器,windows下无法访问如何解决!

    一、windows下无法访问samba 1、smbd没有正常启动;  service smbd  start       启动smbd   service smbd status      查看状态   2、主机和虚拟机需要可以互ping成功 3、共享文件的访问权限设置 4、windows和linux防火墙关闭, 之后重启smbd 5、在运行里面输入格式: “\\\\ +ip”   (因为我就是

    2024年02月05日
    浏览(59)
  • C++项目——集群聊天服务器项目(一)项目介绍、环境搭建、Boost库安装、Muduo库安装、Linux与vscode配置

    今天开始想更新一个C++项目,实现一个 支持跨服务器通信、支持负载均衡的集群聊天服务器项目 。项目会应用muduo网络库、CMake编译、MySQL数据库、JSon序列化与反序列化、Redis消息订阅模式以及Nginx负载均衡功能。 有兴趣的宝可以跟我一起实操起来,巩固自己的C++学习吧~ 本项

    2024年04月14日
    浏览(61)
  • 在Ubuntu服务器上安装和配置Nextcloud- 搭建Nextcloud私有云盘并公网远程访问

    Nextcloud,它是ownCloud的一个分支,是一个文件共享服务器,允许您将个人内容(如文档和图片)存储在一个集中的位置,就像Dropbox一样。与Nextcloud的不同之处在于,它的所有功能都是开源的。它还将敏感数据的控制和安全返回给您,从而消除了对第三方云托管服务的使用。 在本教程中

    2024年02月11日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包