IDEA在WIN系统下搭建调试HADOOP3的MR调试环境

这篇具有很好参考价值的文章主要介绍了IDEA在WIN系统下搭建调试HADOOP3的MR调试环境。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、前言
使用IDEA在本地书写MR程序时候,需要打JAR包上传到服务器执行,不利于调试程序,本文探讨在反复修改程序调试的过程中利用本地环境就可以进行HDFS上的测试。
使用软件为IDEA2021.3+MAVEN3.8.8+HADOOP3.3.6
二、步骤
1、下载HADOOP3.3.6到本地磁盘,解压,注意这个bin目录,一会用到。
idea本地调试hadoop,intellij-idea,mr,java

2、下载HADOOP的WIN工具,因为HADOOP版本较新,没有对应的,我选择的是3.3.5的。可以从https://github.com/cdarlint/winutils下载。
idea本地调试hadoop,intellij-idea,mr,java

把其中的hadoop.dll和winutils.exe文件拷贝到刚才解压的HADOOP路径下的bin目录中。注意:最好放到C:\Windows\System32一份,不然有可能不能运行,可以自己测试。

3、配置系统环境变量,这里HADOOP_USER_NAME属性配置你的虚拟机上的用户,有的不写也行,但是最好指定。
idea本地调试hadoop,intellij-idea,mr,java
idea本地调试hadoop,intellij-idea,mr,java
4、将Hadoop的相关配置文件添加到项目的resources文件夹下,没有的话可以创建此文件夹。
idea本地调试hadoop,intellij-idea,mr,java
注意:也有博客说把mapred-site.xml放进来,可以自己测试
如果想打印日志的话,还需要加上log4j.properties文件,里边代码如下:

需要有日志出现 则需要将下面的添加到src下的log4j.properties下(IDEA需要放在resource的目录下)
log4j.rootLogger=INFO, stdout  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n  
log4j.appender.logfile=org.apache.log4j.FileAppender  
log4j.appender.logfile.File=target/spring.log  
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout  
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n  

5、书写程序,利用Maven创建项目,pom文件部分如下:

<dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>3.3.6</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>3.3.6</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>3.3.6</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-core</artifactId>
            <version>3.3.6</version>
        </dependency>

MR作业的驱动类,指定HDFS运行的路径即可

idea本地调试hadoop,intellij-idea,mr,java
6、开启集群,然后调试修改程序
7、可能出现的情况:
1)连接不到集群,配置下win的hosts文件
假如你是虚拟机的话就配置
192.168.70.15 master 这里的映射换成你自己的实际IP和hostname
检查下虚拟机网络配置,让虚拟机也可以上网文章来源地址https://www.toymoban.com/news/detail-759949.html

到了这里,关于IDEA在WIN系统下搭建调试HADOOP3的MR调试环境的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop3.x完全分布式环境搭建Zookeeper和Hbase

    集群规划 IP地址 主机名 集群身份 192.168.138.100 hadoop00 主节点 192.168.138.101 hadoop01 从节点 192.168.138.102 hadoop02 从节点 Hadoop完全分布式环境搭建请移步传送门 先在主节点上进行安装和配置,随后分发到各个从节点上。 1.1 解压zookeeper并添加环境变量 1)解压zookeeper到/usr/local文件夹

    2024年02月04日
    浏览(33)
  • 【hadoop】centos7.6+hadoop3.1.1搭建分布式hadoop环境——包含各类问题解决方案

    本文针对centos7.4即以上版本的hadoop环境搭建,因为这部分搭建是个很复杂且很容易出错的内容,所以在结合了多种搭建方案后给出最适宜当前版本的搭建。 本教程适用于CentOS 7.4即以上版本,如果是Ubuntu等其它linux内核版本则不适合。 查看系统版本: 软件 版本 获取方法 Ope

    2024年02月16日
    浏览(33)
  • seatunnel win idea 本地调试

    调试FakeSource,LocalFile 调试前准备工作:

    2024年02月07日
    浏览(35)
  • IDEA 运行hql 出现FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTas

    启用的hiveserver2 的模拟用户功能 ,依赖于Hadoop 提供的proxy user(代理用户功能),只有Hadoop中的代理用户才能模拟其他用户身份访问 Hadoop集群。 因此,需要将hiverserver2 的启动用户设置为 Hadoop 的代理用户 修改hadoop 配置文件 core-site.xml 添加如下配置 重启Hadoop 以及Hive 再次运

    2024年02月11日
    浏览(34)
  • Win10 IDEA连接虚拟机中的Hadoop集群(进来保你成)

    目录 引言: 环境: 前提: 实现: 测试 结语: 问题 引言:         分布式课程要求使用IDE(IDEA、Eclipse)来编写程序直接对Hadoop集群进行文件操作,目前关于IDEA连接Hadoop集群的教程,良莠不齐,根据多个教程完成了IDEA连接Hadoop集群。现在将完整的流程陈列如下。      

    2024年02月04日
    浏览(42)
  • IDEA Go语言开发环境无法debug调试

    使用idea 搭建go开发环境后如果debug调试可能会遇到错误: could not launch process: decoding dwarf section info at offset 0x0: too short。 有些回答go get -u github.com/derekparker/delve/cmd/dlv 。如果使用go mod方式开发的话这种方式是行不通的,最直接的方法是把dlv项目下载下来自己编译生成dlv.exe。 进

    2024年02月14日
    浏览(38)
  • IDEA配置Hadoop环境-非maven配置版(图文详细)

    1.1 下载hadoop包 官网地址:https://hadoop.apache.org/releases.html(官网一般都是最新的咯) 说明:版本不要下载太高的,可以下载 2.6.1到3.2.2的版本 ,有就不下了。 1.2 下载hadoop.dll和winutils.exe GitHub地址:https://gitcode.net/mirrors/cdarlint/winutils/-/tree/master 说明: 对应着你的hadoop版本下载 ,

    2024年02月02日
    浏览(42)
  • 【ETL工具】本地环境IDEA远程DEBUG调试Flume代码

    🪁🍁🪁🍁🪁🍁🪁🍁 感谢点赞和关注 ,每天进步一点点!加油! 🪁🍁🪁🍁🪁🍁🪁🍁 目录 🦄 个人主页——🎐个人主页 🎐✨🍁 一、问题说明 二、操作步骤 2.1 idea创建远程调试 Flume 自定义 HDFS-Sink,远程服务器进行部署flume打包好后的代码,本地监控远程flume程序

    2024年02月08日
    浏览(29)
  • IDEA远程调试kubernetes环境中的容器应用(Java应用)

    IDEA远程调试kubernetes环境中的容器应用(Java应用) 应用场景:Java开发的项目在本地运行正常,然后将 容器运行方式的项目发布到远端服务器上线运行后,出现了异常情况,此时频繁去修改代码发布镜像进行问题验证,将耗费较大的时间成本。 为了提高问题定位和代码调试效率

    2024年02月10日
    浏览(38)
  • Hadoop3的高可用搭建

    1. 准备工作 前期准备工作包括了  CenOS 7虚拟化安装与配置, Java虚拟机的安装,  Hadoop相关部署包的下载, Hadoop集群所需基础环境的配置。 第一点CenOS 7虚拟化安装与配置和第二点Java虚拟机的安装: 需要我们参考第一章:大数据技术训练舱——从零开始安装、配置CentOS 7 第

    2024年02月10日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包