【大数据】下载hadoop与jdk

这篇具有很好参考价值的文章主要介绍了【大数据】下载hadoop与jdk。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第一步,ctrl+alt+t 打开终端窗口,执行如下命令:

$ sudo apt-get update

hadoop下载,hadoop,大数据,ubuntu

第二步 安装SSH、配置SSH无密码登陆
1)集群、单节点模式都需要用到 SSH 登陆(类似于远程登陆,你可以登录某台 Linux 主机,并且在上面运行命令),Ubuntu 默认已安装了 SSH client,此外还需要安装 SSH server:

$ sudo apt-get install openssh-server

hadoop下载,hadoop,大数据,ubuntu

2)安装后,可以使用如下命令登陆本机:

$ssh  localhost

此时会有如下提示(SSH首次登陆提示),输入 yes 。然后按提示输入密码,这样就登陆到本机了。
hadoop下载,hadoop,大数据,ubuntu

配置成SSH无密码登陆

hadoop下载,hadoop,大数据,ubuntu
此时再用 ssh localhost 命令,无需输入密码就可以直接登陆了,如下图所示。

hadoop下载,hadoop,大数据,ubuntu
hadoop下载,hadoop,大数据,ubuntu

第三步 安装java
Hadoop3 需要JDK版本在1.8及以上。安装openjdk也可以。
hadoop下载,hadoop,大数据,ubuntu
hadoop下载,hadoop,大数据,ubuntu

安装完成测试一下(出现问题)
hadoop下载,hadoop,大数据,ubuntu

安装JDK
由于hadoop底层是用java写的,所以安装hadoop前需要先安装JDK
安装之前有个小问题,就是之前我们安装软件,直接是apt-get install xxx
为什么JDK的安装不能这样呢?因为安装JDK之前hadoop需要寻找环境变量:JAVA_HOME,里面有很多的配置文件、可执行文件等等。如果使用apt-get install xxx这种方式安装的话,会把配置文件打散,可执行文件在/bin 目录,配置文件在/etc目录,这样的话hadoop找不到对应的文件,就无法运行。
hadoop下载,hadoop,大数据,ubuntu
hadoop下载,hadoop,大数据,ubuntu
hadoop下载,hadoop,大数据,ubuntu

查看ssh是否启动,出现sshd即为启动成功.

hadoop下载,hadoop,大数据,ubuntu

此时再次点击xhell连接虚拟机即可连接成功。连接成功后 shell页面与虚拟机终端页面格式一致。

hadoop下载,hadoop,大数据,ubuntu

使用了Xftp传输文件,直接拖拽就好。这里将jdk文件传输。

hadoop下载,hadoop,大数据,ubuntu

传输后可以直接在虚拟机中看到,将文件移动到到下载里面。(为了好利用指令处理)直接选中拖拽即可。打开终端执行以下指令。

hadoop下载,hadoop,大数据,ubuntu

执行指令查看文件夹是否存在。文件夹存在。

hadoop下载,hadoop,大数据,ubuntu

接下来配置环境变量。

hadoop下载,hadoop,大数据,ubuntu

添加成功后输入source ~/.bashrc指令让修改生效。
输入java -version指令查看jdk是否安装成功,也是查看jdk版本号的代码。
出现一下信息说明jdk安装成功。

hadoop下载,hadoop,大数据,ubuntu

安装 Hadoop3.1.3
之前已经将安装包放在下载里了,所以直接解压就可以。

hadoop下载,hadoop,大数据,ubuntu

$sudo tar -zxf ~/下载/hadoop-3.1.3.tar.gz -C /usr/local
$cd /usr/local/
$sudo mv ./hadoop-3.1.3/ ./hadoop            # 将文件夹名改为hadoop
$sudo chown -R hadoop ./hadoop       # 修改文件权限

hadoop解压后直接就可以使用。
检查是否成功解压也是查看hadoop版本号的指令。

$cd /usr/local/hadoop
$./bin/hadoop version

出现以下信息即为成功。

hadoop下载,hadoop,大数据,ubuntu

Hadoop伪分布式配置
修改core-site.xml文件

$gedit ./etc/hadoop/core-site.xml

<configuration> </configuration>中间添加代码

 <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
</property>

添加前:

hadoop下载,hadoop,大数据,ubuntu

添加后:
hadoop下载,hadoop,大数据,ubuntu

直接Ctrl+S保存。关闭后修改文件文件 hdfs-site.xml

$gedit ./etc/hadoop/hdfs-site.xml

同理,在<configuration> </configuration>中间添加代码

 <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>

添加后:

hadoop下载,hadoop,大数据,ubuntu

配置完成后,执行 NameNode 的格式化

$cd /usr/local/hadoop./bin/hdfs namenode -format

下面是反馈信息的前部分和后部分:
hadoop下载,hadoop,大数据,ubuntu

尝试启动hadoop,开启 NameNode 和 DataNode 进程。
hadoop下载,hadoop,大数据,ubuntu

输入jps查看进程。下图出现4个进程说明配置成功。
hadoop下载,hadoop,大数据,ubuntu

即伪分布式配置成功。

尝试运行实例
首先在 HDFS 中创建用户目录。
将 ./etc/hadoop 中的 xml 文件作为输入文件复制到分布式文件系统。
复制完成后,可以通过./bin/hdfs dfs -ls input命令查看文件列表
伪分布式运行 MapReduce 作业的方式跟单机模式相同
查看运行结果。
hadoop下载,hadoop,大数据,ubuntu

实验心得:
由于是第一次接触hadoop,安装配置过程中都碰到了不少问题,在安装hadoop前,要先准备集群化环境,我准备了三个centos服务器作为节点(分别为node1,node2,node3),并配置他们相互之间的SSH免密登陆,然后开始安装Hadoop,在node1上通过wget命令安装hadoop,由于是外网,安装速度非常慢,于是我上网查询了国内hadoop镜像,然后将安装包下载下来放到node1中解压,然后修改了部分配置文件,最后,在node1中运行start-yarn.sh启动yarn集群,基本就完成了。这个时候就可以在浏览器中访问hadoop了。这个实验让我对linux命令更加熟悉,同时也了解到了hadoop的强大。文章来源地址https://www.toymoban.com/news/detail-714388.html

到了这里,关于【大数据】下载hadoop与jdk的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • hadoop国内镜像下载

    官网下载非常慢,找到了清华大学的镜像站下载很快 清华大学镜像站:稳定版本的https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 选择最后一个hadoop-3.3.0.tar.gz

    2024年02月13日
    浏览(37)
  • hadoop下载,安装

    https://mirrors.tuna.tsinghua.edu.cn/ 从清华源下载 使用64位版本 1,vim /etc/profile 2, 追加hadoop的两个bin路径。一个是bin, 一个是sbin。 解释一下PATH命令的含义。 export PATH=$PATH 表示保留之前的path路径赋值给PATH。 然后追加新的路径用 :隔开。 然后追加路径$HADOOP/bin。 另外hadoop的bin路径

    2024年01月19日
    浏览(28)
  • hadoop 国内镜像 极速下载

    lucene国内镜像 https://mirrors.cloud.tencent.com/apache/hadoop/common/

    2024年02月11日
    浏览(42)
  • 【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )

    Hadoop 发布版本在 https://hadoop.apache.org/releases.html 页面可下载 ; 当前最新版本是 3.3.6 , 点击 Binary download 下的 binary (checksum signature) 链接 , 进入到 Hadoop 3.3.6 下载页面 : 下载地址为 : https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz 官方下载速度很慢 ; 这里提供一个 Hadoop 版

    2024年02月13日
    浏览(71)
  • hadoop的安装教程( Ubuntu 系统)

    目录 一、创建hadoop用户 二、更新apt  三、安装SSH、配置SSH无密码登陆 四、安装Java环境  五、安装 Hadoop 六、检验jdk、hadoop的安装成果 七、Hadoop单机配置 八、 Hadoop完全分布式配置 一、 创建hadoop用户 如果安装 Ubuntu 的时候 设置用户名时 用 的不是  \\\"hadoop\\\" 用户,那么需要增

    2024年02月03日
    浏览(38)
  • ubuntu中Hadoop伪分布安装

    目录 1. 更新apt和安装VIm编辑器 2. 安装SSH 3. 查看IP 4. 安装Java环境 5. Hadoop伪分布安装 Hadoop伪分布安装。主要参考《大数据技术原理与应用》第三版。 1. 更新apt和安装VIm编辑器 命令如下: 提示输入密码,完成密码输入即可自动更新 可以使用Vim编辑器完成文件创建与修改,安装

    2024年04月13日
    浏览(22)
  • Ubuntu虚拟机以及hadoop的安装

    安装vbox 安装过程略 安装Ubuntu20.04 点击,获取下载链接,找到列表中的ubuntu . 点击 20.04.5,desktop,livedvd,下载iso 三、Ubuntu在vbox中的安装过程 设置4G内存,40G虚拟硬盘,32M显存,2个虚拟CPU 安装过程中,开始选英文,不要选中文。 用户设置成hadoop,密码自己定。 安装过程略。

    2023年04月08日
    浏览(20)
  • ubuntu服务器版本搭建Hadoop集群

    实验环境: 虚拟化软件:VMware® Workstation 16 Pro 镜像:ubuntu-22.04.2-live-server-amd64.iso Hadoop版本:hadoop-3.3.4.tar.gz ubuntu镜像链接 hadoop文件链接 配置虚拟机 (1)新建虚拟机,选择实验镜像【ubuntu-22.04.2-live-server-amd64.iso】 (2)调整硬件配置,配置如图 安装操作系统 (1)选择虚拟

    2024年02月08日
    浏览(53)
  • Ubuntu 16.04——Hadoop集群安装配置

    hadoop 集群安装配置分为两个部分,一个部分是 主节点(Master) 和 从节点(Slave) ,两个部分需要完成的配置有一定的不同;总的来说,Master 所需要做的会比 Slave 会多一些。下面会演示两个部分需要做的事情;由于各台主机情况会有所不同,所以在报错的时候也会有一些的

    2024年02月02日
    浏览(51)
  • ubuntu系统hadoop伪分布搭建详细教程

    目录 vim命令编辑器安装 SSH配置 JDK配置 hadoop 配置  hadoop 配置文件  集群格式化及启动 文中jdk与hadoop版本可能与博主不同 文中出现的所有jdk1.8.0_361和hadoop-2.7.7都要换成你所下载的jdk和hadoop版本,下方链接是我的jdk和hadoop压缩包自行提取。 链接:https://pan.baidu.com/s/132aoruf7SuU

    2024年02月07日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包