Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆教程

这篇具有很好参考价值的文章主要介绍了Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆级教程

准备工作

我下载的压缩包是基于 Windows 系统 x86 指令集的,如果你是苹果电脑可能需要选择 ARM 版本
3.21 更新:hadoop 某些功能不支持 JDK11 及以上版本(如网页管理无法查看文件系统),所以下载时选择 JDK8,官网需要登陆甲骨文账号下载

  1. 全新的 ubuntu 虚拟机 https://ubuntu.com/download/desktop
  2. JDK 压缩包(for linux x64 Compressed Archive) https://www.oracle.com/java/technologies/downloads/
  3. Hadoop 压缩包(Binary download) https://hadoop.apache.org/releases.html
  4. 充分使用 VMware 虚拟机的快照功能,在出错时进行回档
  5. 你的双手以及专注认真的美好品格

一、配置你的新系统

此时我使用的是刚装好的全新虚拟机,后面的流程以及截图我会全部使用此虚拟机重进操作,如果你已经拥有配置良好的虚拟机可以在目录跳转到你需要的章节

1. 更换国内源并更新软件

进入新系统后会提示你更新软件,这时我们先选择跳过,因为速度很慢。为了提升软件更新的速度,建议使用国内源,可大幅提升更新速度,我们点击桌面左下角的全部软件
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他点击紫色的这个图标进入软件与更新设置
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他Download from 选择框点击 Other 选项
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他点击 Select Best Server 自动寻找最佳服务器,根据我自己的测试,直接在这里选择就好,不需要去改文件
等待查询完毕
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他完成后直接点击 Choose Server
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他点击 Reload 更新依赖
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他关闭设置界面回到桌面,再次点击左下角,这次打开银色的这个软件更新器
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他更新软件,等待更新完成,我这里能跑到十几兆每秒的速度,都没来得及截图就进入到了安装步骤
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
更新完成后选择立即重启
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
软件更新完成

2. 将事先准备的压缩包复制到虚拟机

根据自己的喜好选择一个位置存放我们准备好的压缩包,我选择放在用户主文件夹下的 Downloads 文件夹下
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

3. 其他注意事项
  1. 在你自定义你的虚拟机设置时做好不要更换你的桌面图片,如果你直接从主机上找来张图片放进虚拟机并设为壁纸,之后重启登陆进入系统可能会导致黑屏,具体原因不详,我自己因为这种原因重装了两次系统(属实大坑)
  2. 安装过程中遇到一些诸如权限不足时尽量使用管理员身份执行,而不要去随意改动系统文件夹的归属权
  3. 本文会使用系统自带的编辑器进行文件的修改,如果不习惯可以安装一个 VS Code 修改文件很方便,权限不足时可以输入管理员密码直接保存更改
  4. 每完成一部分配置最好保存一个虚拟机快照,在后续配置出错时能回档

二、安装与配置 Java 环境

1. 解压 JDK 压缩包并移动位置

在之前存放压缩包的文件夹右键打开菜单,选择在终端打开
3.21更新:后续测试发现网页管理 hdfs 文件时出现错误,所以 JDK 版本更改为 1.8.0_x
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
使用指令 tar -zxvf jdk-17_linux-x64_bin.tar.gz 解压 JDK 压缩包(后面的文件名是你自己下载的压缩文件名)
注意不同压缩格式解压指令不同,我以通常情况下的 tar.gz 压缩包为例
解压完成后原目录会出现解压后的文件夹
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
继续在终端输入指令 sudo mv jdk-17.0.2 /usr/java 将解压后的文件夹移动到 /usr/java 下(需要输入管理员密码)
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
检查移动是否成功
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

2. 配置环境变量

打开 Home 文件夹,在右上角选项中选中显示隐藏文件
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
找到名为 .profile 的文件,用文本编辑器打开它,然后在末尾添加如下代码

export JAVA_HOME=/usr/java

# JDK8 添加 JRE_HOME 和 CLASSPATH 配置
export JRE_HOME=$JAVA_HOME/jre
CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH

注意不要多空格或少空格,建议直接复制,修改完成后点击 Save 进行保存
下面图片与上面代码不一致,请以上述代码为准
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
终端输入 source ~/.profile 应用我们配置的环境变量
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

建立系统软链接
sudo update-alternatives --install /usr/bin/javac javac /usr/java/bin/javac 1
sudo update-alternatives --install /usr/bin/javac java /usr/java/bin/java 1
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

3. 检查安装

终端输入 java --versionjava -version 检查是否配置成功,出现下面的 java 版本提示说明配置成功
3.21更新:为兼容 Hadoop,Java 版本更改为 Java 1.8.0_x
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

三、安装与配置 Hadoop

1. 解压 Hadoop 压缩包并移动位置

我们回到存放压缩包的文件夹,同样右键选择在终端打开
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
使用指令 tar -zxvf hadoop-3.3.2.tar.gz 解压压缩包,目录下会出现解压后的文件夹
继续使用指令 sudo mv hadoop-3.3.2 /usr/hadoop 将文件夹移动到 /usr/hadoop 目录下(需要管理员密码)
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

2. 配置 JDK 路径

打开文件管理器,找到 Hadoop 安装目录下的 /etc/hadoop/hadoop-env.sh 并使用文本编辑器打开(默认双击)
注意此处是 hadoop-env.sh 而不是 hadoop-env.cmd
在文件末尾添加以下代码(建议直接复制)并保存退出

export JAVA_HOME=/usr/java

hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

3. 配置 Hadoop

在刚刚的目录下找到 core-site.xml 文件,用文本编辑器打开
<configuration> 标签中添加下面的配置,保存并退出

  <property>
    <name>hadoop.tmp.dir</name>
    <value>file:/usr/hadoop/tmp</value>
  </property>

  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>

hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
继续在文件夹中找到 hdfs-site.xml 文件,用文本编辑器打开
<configuration> 标签中添加下面的配置,保存并退出

  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>

  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/usr/hadoop/tmp/dfs/name</value>
  </property>

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/hadoop/tmp/dfs/data</value>
  </property>

  <property>
    <name>dfs.http.address</name>
    <value>0.0.0.0:50070</value>
  </property>

hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他

4. 启动

打开任意终端,进入 /hadoop/bin 路径 cd /usr/hadoop/bin
执行指令 ./hdfs namenode -format 进行格式化
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
进入 /hadoop/sbin 路径 cd /usr/hadoop/sbin
执行指令 ./start-all.sh 启动 hadoop
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
执行指令 jps 查看运行的进程
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
打开浏览器输入 http://localhost:50070 进入 web 管理页面
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
至此 Hadoop 配置完成

四、附录

1. ssh 免密登陆设置

安装 openssh 服务 sudo apt-get install openssh-server
使用管理员密码验证,询问是否继续时输入 y
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
登陆主机 ssh localhost
询问是否继续时输入 yes 然后输入管理员密码进行登录
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
退出主机 exit
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
打开文件管理器,在 Home 中找到 .ssh 文件夹,进入
这个文件夹默认是隐藏的,但前面我们开启了显示隐藏文件
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他进入 .ssh 文件夹后右键,选择在终端打开
在终端输入指令 ssh-keygen -t rsa 创建公钥与私钥
过程中需要按几次回车,直到创建完毕
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
我们创建的公私钥文件
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
继续在终端输入 cat ./id_rsa.pub >> ./authorized_keys 进行免秘钥登陆授权
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
此时设置完成,再使用 ssh localhost 登陆主机已经不需要密码了
将私钥文件复制并注册到另一台计算机,可以实现远程访问

2. VS Code 安装与使用

不要直接在应用商店下载 VSCode,因为会出现无法输入中文的问题
官方下载地址:https://code.visualstudio.com/Download
下载 .deb 安装包直接运行安装

安装中文扩展
在扩展商店搜索 Chinese 找到第一个扩展点击 Install 安装,完成后在右下角弹窗中点击 Change Language and Restart
重启后即可应用中文界面
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
安装 Java 扩展
在 扩展商店搜索 java 选择 Extension Pack for Java 安装后即可秒变 IDE 开始创建 java 项目
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他
创建完成的示例可直接运行,按 F5
hadoop unbuntu 保姆,笔记,ubuntu,linux,hadoop,经验分享,其他文章来源地址https://www.toymoban.com/news/detail-730683.html

到了这里,关于Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop3.3.6安装和配置hbase-2.5.5-hadoop3x,zookeeper-3.8.3

    vm设置 在安装过程中推荐设置root用户密码为1234方面后续操作 1.设置主机名 以hadoop3为例 2.设置固定ip hadoop1 192.168.88.201 hadoop2 192.168.88.202 hadoop3 192.168.88.203 最后执行 service network restart 刷新网卡 3.工具连接(三个机器都要设置) 4.主机映射 windows: C:WindowsSystem32driversetc 修改这个路

    2024年02月03日
    浏览(21)
  • Hadoop(01) Hadoop3.3.6安装教程,单机/伪分布式配置

    在安装 Hadoop 3.3.6 前,需要满足以下前置条件: Java Development Kit (JDK):Hadoop 是用 Java 编写的,因此需要安装并配置适当版本的 JDK。Hadoop 3.3.6 建议使用 JDK 8 或更高版本。确保正确安装 JDK,并设置 JAVA_HOME 环境变量。 SSH:Hadoop 集群中的节点需要通过 SSH 进行通信和管理。确保在

    2024年02月06日
    浏览(23)
  • CentOS7 Hadoop3.3.0 安装与配置

    一、安装JDK 1、创建文件夹tools和training用于存放压缩包和解压使用,tools存放压缩包,training用于解压后安装jdk和hadoop的路径。 1)回到路径为 / 的位置 2) 创建 tools 和 training 3) 进入tools文件夹 4) 左边mobaxterm里面点击进入/tools文件夹,将发给大家的 压缩包直接鼠标拖入进去,拖

    2024年02月09日
    浏览(19)
  • Hadoop3.1.3安装教程单机伪分布式配置

    本教程使用 Ubuntu 18.04 64位 作为系统环境(或者Ubuntu 14.04,Ubuntu16.04 也行,32位、64位均可),请自行安装系统。装好了 Ubuntu 系统之后,在安装 Hadoop 前还需要做一些必备工作。 创建hadoop用户 如果你安装 Ubuntu 的时候不是用的 “hadoop” 用户,那么需要增加一个名为 hadoop 的用

    2024年02月04日
    浏览(26)
  • Ubuntu20.04下安装fabric2.3.2环境 从零开始超详细步骤!亲测有效!

    本人以前有写过ubuntu16.04下安装fabric1.4.3的步骤和踩坑处理,如果需要那个版本的可以点击: https://blog.csdn.net/wyt813990159/article/details/117411856?spm=1001.2014.3001.5502 还有一篇文章是博主总结的安装过程中踩过的坑 (15条消息) fabric安装环境和运行测试网络时的踩坑合集!_wyt813990159的博

    2023年04月10日
    浏览(19)
  • Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置

    华为云耀云服务器试用领取 领取的试用云耀云服务器在哪 阿里云服务器免费试用领取 Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置 阿里云服务器ECS安装图形界面 本篇文章是基于上一篇所配置好的云服务器进行实验软件安装,该系列文章是根据林子雨所讲述的课程就在

    2024年01月21日
    浏览(32)
  • 大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

    **相关资源:**https://musetransfer.com/s/q43oznf6f(有效期至2023年3月16日)|【Muse】你有一份文件待查收,请点击链接获取文件 1.检查是否安装ssh (CentOS 7 即使是最小化安装也已附带openssh 可跳过本步骤) 若已安装进行下一步骤 若未安装 请自行百度 本教程不做过多讲解 2.配置ss

    2023年04月08日
    浏览(21)
  • ubuntu20.4 静态网络配置(保姆级图文教程)

    之前一直使用的Linux系统都是centOs,突然换成Ubuntu之后不知道怎么配置网络,网上查找了很多资料都不可用,最后终于在一篇博客里看到了20.4版本的网络配置教程,在此贴上链接,并记录 Linux ubuntu20.04 网络配置(图文教程)_ubuntu20.04网络配置_isOllie的博客-CSDN博客 系统:ubu

    2024年02月05日
    浏览(20)
  • Hadoop3教程(十一):MapReduce的详细工作流程

    本小节将展示一下整个MapReduce的全工作流程。 首先是Map阶段: 首先,我们有一个待处理文本文件的集合; 客户端开始切片规划; 客户端提交各种信息(如切片规划文件、代码文件及其他配置数据)到yarn; yarn接收信息,计算所需的MapTask数量(按照切片数); MapTask启动,读

    2024年02月07日
    浏览(25)
  • ubuntu20.04配置hadoop&&spark(直接配置,无需借助虚拟机)

    hadoop作为一个开源的分布式计算和存储框架,在人工智能、大数据领域有非常广泛的应用。笔者在查阅资料发现网络博客介绍的配置方法大多需要借助虚拟机,或者需要重新创建ubuntu账户并设置密码为空以避免hadoop连接不上的问题,甚至是在ubuntu系统内再搭建一个虚拟机的

    2024年04月17日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包