基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录)

这篇具有很好参考价值的文章主要介绍了基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

前言

一.JDK的下载安装配置

1.JDK 下载

2.JDK 安装

3.JDK 环境变量配置

4.验证JDK安装是否成功

5.重点?

二.Hadoop部署以及工具集winutils

1.下载Hadoop解压/下载winutils以及"安装"

        下载Hadoop和winutils

        "安装"winutils

2.配置Hadoop环境变量/配置Hadoop文件

Hadoop配置环境变量

 hadoop-env.cmd

core-site.xml

创建data文件夹以及datanode和namenode

hdfs-site.xml

初始化namenode

启动hadopp

打开WEB管理页面

3.Hadoop部署过程的重点?

总结


前言

如题这是一个我个人的学习记录,学习目标就是Hadoop的伪分布模式的部署,所以在Hadoop,JDK等等背景不做过多介绍,直接开始部署吧.

一.JDK的下载安装配置

1.JDK 下载

下载地址:Java Archive Downloads - Java SE 8u211 and later

页面下滑找到对应自己电脑系统和版本的 JDK 源文件,我下载的是Windows系统64位版本

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

2.JDK 安装

小tips: 像这样开发环境还有python杂七杂八的环境,能就尽可能放在自定义目录当中,易于管理(但这里我的话就选择直接默认安装了,毕竟不怎么用管啥哈哈哈)

直接双击打开就行:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

"欢迎仪式",点击下一步:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

再下一步:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

"状态"满了之后会回空静止,会弹出一个新的窗口:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

这个是安装 JAVA 的路径,刚才安装的是 JDK 同样有需要可以更改路径,确认好路径就可以下一步了::

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

很快啊,啪的一下就完成了:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

同时这个也会成功

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

可以去安装路径看一眼good(路径待会得用到可以留着窗口复制)基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

3.JDK 环境变量配置

我个人会使用Win+R 输入,感觉比较方便

sysdm.cpl

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

点击高级就可以看到环境变量了

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

在系统变量中新建:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

新建一个变量名位 JAVA_HOME ,变量值为刚才安装 jdk的安装路径,如果路径跟我一样也可以直接复制:

C:\Program Files\Java\jdk-1.8

设置完点击确认:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

找到系统变量里的Path点进去基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

新建两个环境变量,因为学习过程中发现网络上很多出现因为只设置" \bin "路径导致的某些错误,我索性就直接两个都设置了

%JAVA_HOME%\jre\bin
%JAVA_HOME%\bin

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

也可以绝对路径配置环境变量像这样

4.验证JDK安装是否成功

最简单的验证方法,尝试获取版本:

Win + R  --> cmd 基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

输入:

java -version

如果如图显示了你所下载版本的版本号,说明JDK安装成功!

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

5.重点?

!!!一定要确定环境变量路径正确,这是在这个环节我目前能总结的唯一问题!!!

二.Hadoop部署以及工具集winutils

1.下载Hadoop解压/下载winutils以及"安装"

        下载Hadoop和winutils

Hadoop下载地址:Index of /dist/hadoop/common/hadoop-3.2.0 (apache.org)

winutils  下载地址:cdarlint/winutils: winutils.exe hadoop.dll and hdfs.dll binaries for hadoop windows (github.com)

可以根据你需要的版本进行下载我这里选择的是3.2.0版本

!!!Hadoop版本和winutils版本一定要相同!!!

 Hadoop下载" hadoop-3.2.0.tar.gz "

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop 

下载winutils,点击"  code" -->download zip(下载压缩包),为什么不之下3.2.0的winutils,原因是......我不知道怎么在GitHub上单独下载一个文件夹,乐.(但是winutils所有版本加起来也没多大,问题不大)基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

下载完成:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

我有360压缩可行所以我就直接用360解压了

也可以无需任何软件解压:

Win + R --> cmd --> 输入" G: " 再输入你的Hadoop压缩包的位置 (注意是你自己电脑的压缩包位置),如图划线部位,说明你已经进入了压缩包的位置,再输入

# tar -zxvf 你下载的版本的压缩包全称包括后缀名,如果你的位置只有这个压缩包  Tab键可以直接补全
tar -zxvf hadoop-3.2.0.tar.gz

 等待解压:基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

解压出hadoop-3.2.0文件夹如下图:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

        

        "安装"winutils

 打开压缩包找到对应版本bin全部放到hadoop\bin里建议先将winutils压缩包里的bin解压出来再复制粘贴,因为我发现从360解压拖到Hadoop的bin无法全部成功替换,如第二张替换解说图

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

先解压出来再复制粘贴到 hadoop-3.2.0文件夹下的 bin

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

这样就算是" 安装"好了.

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

2.配置Hadoop环境变量/配置Hadoop文件

Hadoop配置环境变量

如JAVA_HOME一样,不做赘述

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

 hadoop-env.cmd

还有一个重要的点,进入 hadoop-3.2.0 的 etc再进入hadoop 文件夹 找到hadoop-env.cmd,右键在记事本中编辑基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

将%JAVA_HOME%更改为JDK 的绝对路径 (路径中不能存在空格) 我的路径在" C:\Program Files\Java\jdk-1.8 "所以更改为如下," PROGRA~1 " 和 " Program Files "是一样的等价替换的.

C:\PROGRA~1\Java\jdk-1.8

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

修改完这个路径以及环境变量后,尝试获取版本号.

hadoop version

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

        接下来还需要配置核心文件 core-site.xml  hdfs-site.xml

core-site.xml

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

同样以右键笔记本中编辑,配置内容可以直接覆盖使用

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

创建data文件夹以及datanode和namenode

在hadoop-3.2.0目录下新建data文件夹,然后在data目录下再新建datanode和namenode文件夹

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

hdfs-site.xml

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

 这里的路径一定要和你自己namenode和datanode路径相同且在盘路径前也需要'/'

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/G:/Hadoop/hadoop-3.2.0/data/namenode</value>这里的路径
一定要和你自己namenode路径相同且在盘路径前也需要'/'
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/G:/Hadoop/hadoop-3.2.0/data/datanode</value>这里的路径
一定要和你自己datanode路径相同且在盘路径前也需要'/'
    </property>
</configuration>

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

初始化namenode

先打开hadoop-3.2.0/bin文件夹在路径栏直接输入cmd,也可以直接在当前目录打开命令提示符(cmd)基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

输入:

hdfs namenode -format

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

显示了如图信息说明初始化成功:

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

启动hadopp

命令提示符(cmd)窗口进入hadoop-3.2.0目录下的 sbin (记得是sbin文件夹一开始我傻子以为教程写错了进了bin......) 也可以直接在sbin目录的路径栏cmd在当前位置打开cmd

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

输入并回车启动服务:

start-dfs.cmd

 这时会弹出两个命令提示符窗口,千万不要关闭,且就我的经验来说,如果两个弹出窗口都没有回到可输入状态,如图,说明服务已经启动成功!

 不要管这两个窗口在最开始输入start-dfs.cmd的窗口输入" jps " 检查启动的服务基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

 输入jps 如果出现以下进程说明Hadoop启动成功

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

打开WEB管理页面

成功后可以打开WEB管理页面查看Hadoop的状态以及操作,启动服务后不要关闭命令提示符窗口,在浏览器中打开如下网址即是Hadoop的网页管理界面

http://localhost:9870

基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

在这里可以进行文件的相关操作了 基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录),分布式,windows,hadoop

3.Hadoop部署过程的重点?

确保操作中的路径正确

winutils版本要和Hadoop匹配

Java环境变量配置正确

总结

以上就是我一次又一次配置失败,一次又一次不甘心,一次次尝试最后成功的学习笔记,回想起来有些操作失误真的挺傻的,真可恶啊,有些教程讲的不明白导致我没看明白(好吧是我基础不够没能理解),我现在作为傻瓜来设计了这么一个直达式教程希望对你有用.goodgood,接下来要尝试创建虚拟机来部署Hadoop,要是可以的话还会再出.See U文章来源地址https://www.toymoban.com/news/detail-849501.html

到了这里,关于基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • (大数据开发随笔9)Hadoop 3.3.x分布式环境部署——全分布式模式

    分布式文件系统中,HDFS相关的守护进程也分布在不同的机器上,如: NameNode守护进程,尽可能单独部署在一台硬件性能较好的机器中 其他的每台机器上都会部署一个DataNode进程,一般的硬件环境即可 SecondaryNameNode守护进程最好不要和NameNode在同一台机器上 守护进程布局 Name

    2023年04月16日
    浏览(60)
  • 毕业设计项目:基于SpringBoot+Hadoop+Vue企业级网盘分布式系统的设计与实现

    2.1 运行环境 2.2 基本处理流程 企业网盘系统的使用者分为企业普通员工和企业管理员,所以进行的基本处理流程是不一样的。企业普通员工进入本系统前台主界面后看到的是首页数据大盘,系统右上角有用户的头像和系统公告通知。在首页顶部的位置有个欢迎用户功能,此模

    2024年02月05日
    浏览(70)
  • 【云计算平台】Hadoop全分布式模式环境搭建

    此前搭建了hadoop的单机模式与伪分布式模式: 单机模式部署 伪分布式模式部署 中间拖得有点久了,今天索性做个了结,把hadoop的全分布式模式部署的操作也简单地记录一下,算是一个系统性的学习吧。 伪分布式模式是学习阶段最常用的模式,它可以将进程都运行在同一台机

    2023年04月08日
    浏览(57)
  • 判断hadoop伪分布式安装模式是否成功启动

    1.使用命令start-all.sh,来同时启动HDFS和YARN start-all.sh  2.通过命令 jps 检验一下是否开启Hadoop的全部进程  如图所示:DataNode,NameNode,SecondaryNameNode是文件系统HDFS的进程; NodeManager,ResourceManager是YARN的进程。这五个进程都启动成功,才说明Hadoop启动成功。

    2024年02月13日
    浏览(56)
  • Hadoop集群部署(完全分布式模式、hadoop2.7.3+安装包)

    目录 一、上传、解压配置 (一)上传 (二)解压 (三)配置hadoop系统环境变量 1.配置hadoop环境变量 2.让环境变量生效 3.验证hadoop系统环境变量 二、修改配置文件  (一)前置介绍 (二)更改配置文件 1.配置Hadoop集群主机点 2.修改core-site.xml文件 3.修改hdfs-site.xml文件 4.修改

    2024年04月25日
    浏览(58)
  • Hadoop(伪分布式)+Spark(local模式)搭建Hadoop和Spark组合环境

    环境 使用 Ubuntu 14.04 64位 作为系统环境(Ubuntu 12.04,Ubuntu16.04 也行,32位、64位均可),请自行安装系统。 Hadoop版本 : Hadoop 2.7.4 创建hadoop用户 如果你安装 Ubuntu 的时候不是用的 \\\"hadoop\\\" 用户,那么需要增加一个名为 hadoop 的用户。 首先按 ctrl+alt+t 打开终端窗口,输入如下命令创

    2023年04月08日
    浏览(70)
  • 部署HDFS集群(完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包)

    目录 前置 一、上传解压 (一 )上传 (二)解压 二、修改配置文件 (一)配置workers文件 (二)配置hadoop-env.sh文件 (三)配置core-site.xml文件 (四)配置hdfs-site.xml文件 三、分发到hp2、hp3, 并设置环境变量 (一)准备数据目录    (二)配置环境变量 四、创建数据目录,并

    2024年04月14日
    浏览(57)
  • Hadoop完全分布式安装基于Docker

    (都在root用户下) 在Dockfile文件中添加以下内容 基于centos镜像,生成带有spenssh-server、openssh-clients的镜像,用户为root,密码为a123456,镜像维护者(作者)为hadoop 建好Dockerfile文件后,生成镜像,在终端输入: 1、在主机下载ssh 2、把hadoop和jdk传到/root 3、解压hadoop和jdk 4、生成带

    2024年04月29日
    浏览(51)
  • Hadoop分布式文件系统(三)

    目录 一、Hadoop 1、MapReduce 1.1、理解MapReduce思想 1.2、分布式计算概念 1.3、MapReduce介绍 1.4、MapReduce特点 1.5、MapReduce局限性 1.6、MapReduce实例进程 1.7、MapReduce阶段组成 1.8、MapReduce数据类型 1.9、MapReduce官方示例 1.9.1、示例说明--圆周率PI评估 1.9.2、官方示例--WordCount单词统计 1.10、

    2024年01月16日
    浏览(47)
  • 基于Linux的Hadoop伪分布式安装

    1.1 创建新用户(需注意权限问题:切换为root用户) 1.2 添加新用户hadoop,并设置相关信息(一直回车默认就可以) 1.3 退出当前用户登录hadoop用户(或直接在Ubuntu中切换用户即可) 1.4 以管理员身份(root用户)执行指令visudo,来修改配置 visudo打开的是 /etc/sudoers 文件,修改该

    2024年02月03日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包