配置Kettle连接大数据HDFS

这篇具有很好参考价值的文章主要介绍了配置Kettle连接大数据HDFS。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

需求:配置Kettle连接大数据HDFS

Kettle对接大数据平台的配置

一.软件环境

1.Hadoop集群,版本:Hadoop3.3.0

2.ETL工具Kettle,版本:pdi-ce-7.0.0.0-25

(解压命令:*.zip 用 unzip 解压)

3.MySQL服务器,版本:mysql5.7.37

二.修改Kettle配置文件

1.文件名称:

/home/hadoop/software\data-integration\plugins\pentaho-big-data-plugin\plugin.properties

2.修改参数:

active.hadoop.configuration=hdp24

配置Kettle连接大数据HDFS

3. Kettle连接HDFS需要替换的Hadoop文件

文件路径:

/home/centos01/software/data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations/hdp24 

文件名称:

1. core-site.xml

2. mapred-site.xml

3. yarn-site.xml

如果需要使用HBase集群,hbase-site.xml文件也需要替换

替换命令:

cp yarn-site.xml /home/centos01/software/data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations/hdp24

(依次替换即可)

之后输入spoon.sh即可进入该软件:

配置Kettle连接大数据HDFS

 

配置Kettle连接大数据HDFS

 

双击hadoop的output文件,进行配置:

配置Kettle连接大数据HDFS

 

三.配置Kettle连接MySQL

命令:

cp mysql-connector-java-5.1.32.jar /home/centos01/software/data-integration/lib

配置Kettle连接大数据HDFS

 

四、配置Kettle连接HDFS

这里的bigdata001.txt文件将用来存储后面同步的数据:

配置Kettle连接大数据HDFS

 

传输数据:

配置Kettle连接大数据HDFS

数据已同步到大数据平台:

配置Kettle连接大数据HDFS

即可。文章来源地址https://www.toymoban.com/news/detail-487963.html

到了这里,关于配置Kettle连接大数据HDFS的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Kettle连接人大金仓KingbaseES数据库

    一、方法1:某些情况下连接上数据库后,加载数据较慢,甚至卡死时,可往下参考方法2。 1、驱动下载。在人大金仓官网–通用型数据库–接口驱动– JDBC 驱动程序 X86(第一个驱动包)下载出来,直达链接(点此直达)。 2、解压驱动包。注意,驱动包zip文件里面共有6个文

    2024年02月05日
    浏览(155)
  • 一百五十九、Kettle——Kettle9.2通过配置Hadoop clusters连接Hadoop3.1.3(踩坑亲测、附流程截图)

    由于kettle的任务需要用到Hadoop(HDFS),所以就要连接Hadoop服务。 之前使用的是kettle9.3,由于在kettle新官网以及博客百度等渠道实在找不到shims的驱动包,无奈换成了kettle9.2,kettle9.2的安装包里自带了shims的驱动包,不需要额外下载,挺好! kettle9.2.0安装包网盘链接,请看鄙人

    2024年02月12日
    浏览(64)
  • kettle与MySQL数据库建立连接教程

    1、下载mysql8.0的jar驱动 https://mvnrepository.com/artifact/mysql/mysql-connector-java/8.0.28 2、将下载好的mysql的驱动放到kettle安装文件中的lib下面,然后重启Spoon 3 、建立连接的两种方式 第一种方式:数据库 连接

    2024年02月04日
    浏览(50)
  • kettle安装、MySQL数据库连接、报错处理

      目录 1.环境配置  2.安装kettle 3.连接数据库 4.连接数据库报错处理 报错一   报错二 前言:跟kettle斗智斗勇的一下午,下面是我踩过的一些坑,希望对大家在安装配置kettle时有所帮助,首先放一张我成功的截图:   在安装使用kettle时需要配置Java环境; jdk官网下载连接如下

    2024年02月07日
    浏览(58)
  • 一百四十七、Kettle——Linux上安装的kettle8.2连接ClickHouse数据库

    kettle8.2在Linux安装好后,需要与ClickHouse数据库建立连接 https://pan.baidu.com/s/1iqGyXsTaQSCHEbjj7yX7AA 提取码: mvzd   注意 : clickhouse-plugins文件里就是自定义的驱动jar包 注意: 要知道Linux系统架构是64位还是32位, 它们所属的Linux文件夹不同 到这里,Linux安装的kettle8.2就可以与ClickHou

    2024年02月13日
    浏览(66)
  • kettle工具连接elasticsearch 7并导入MySQL表数据-简述

    一、简述 工作中需要利用kettle开源ETL工具将MySQL数据库中表数据同步到elasticsearch集群中。为此特记录一下操作方式,留作记录和学习。 二、环境 kettle工具:kettle 9.2 elasticsearch集群:7.11.1 集群配置信息: 集群名称:my-application 集群节点:192.168.172.200(node-1)、192.168.172.201(node

    2024年02月01日
    浏览(44)
  • 一百五十六、Kettle——Linux上安装的Kettle9.3连接ClickHouse数据库(亲测,附流程截图)

    kettle9.3在Linux上安装好后,需要与ClickHouse数据库建立连接 1、kettle版本是9.3 2、ClickHouse版本是21.9.5.16   https://pan.baidu.com/s/1iqGyXsTaQSCHEbjj7yX7AA 提取码: mvzd 注意 : clickhouse-plugins文件里就是自定义的clickhouse驱动jar包    注意 : 要区分Linux系统架构是64位还是32位, 它们所属的L

    2024年02月12日
    浏览(63)
  • 一百六十八、Kettle——用海豚调度器定时调度从Kafka到HDFS的kettle任务脚本(持续更新追踪、持续完善)

    在实际项目中,从Kafka到HDFS的数据是每天自动生成一个文件,按日期区分。而且Kafka在不断生产数据,因此看看kettle是不是需要时刻运行?能不能按照每日自动生成数据文件? 为了测试实际项目中的海豚定时调度从Kafka到HDFS的kettle任务情况,特地提前跑一下海豚定时调度这个

    2024年02月09日
    浏览(54)
  • 用海豚调度器定时调度从Kafka到HDFS的kettle任务脚本

    在实际项目中,从Kafka到HDFS的数据是每天自动生成一个文件,按日期区分。而且Kafka在不断生产数据,因此看看kettle是不是需要时刻运行?能不能按照每日自动生成数据文件? 为了测试实际项目中的海豚定时调度从Kafka到HDFS的Kettle任务情况,特地提前跑一下海豚定时调度这个

    2024年04月15日
    浏览(38)
  • 一百六十八、Kettle——用海豚调度器定时调度从Kafka到HDFS的任务脚本(持续更新追踪、持续完善)

    在实际项目中,从Kafka到HDFS的数据是每天自动生成一个文件,按日期区分。而且Kafka在不断生产数据,因此看看kettle是不是需要时刻运行?能不能按照每日自动生成数据文件? 为了测试实际项目中的海豚定时调度从Kafka到HDFS的kettle任务情况,特地提前跑一下海豚定时调度这个

    2024年02月10日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包