快速上手kettle(一)壶之简介

这篇具有很好参考价值的文章主要介绍了快速上手kettle(一)壶之简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

快速上手kettle系列文章目录

快速上手kettle(一):壶之简介
快速上手kettle(二):Kettle初体验
快速上手kettle(三):Kettle转换(博主正在玩命更新中)
快速上手kettle(四):Kettle作业(博主正在玩命更新中)
快速上手kettle(五):Kettle实际使用(博主正在玩命更新中)
快速上手kettle(六):Kettle资源库(博主正在玩命更新中)
快速上手kettle(七):Kettle调优(博主正在玩命更新中)

目录
  • 一、前言
  • 二 、ETL简介
  • 三、Kettle 简介
    • 3.1 kettle是什么?
    • 3.2 kettle两种设计
    • 3.3 kettle核心组件
    • 3.4 kettle 优点
  • 四、Kettle安装
    • 4.1 下载地址
    • 4.2 kettle目录及文件介绍
    • 4.3 kettle 安装
    • 4.4 kettle界面介绍

一、前言

最近由于工作需要,需要用到kettle工具进行数据迁移转换。特意找资料学习了一下,kettle基本操作算是学会了。

所学的也结合实际工作进行了验证。为了防止以后用到忘记了,便写了几篇文章记录一下。

快速上手kettle(一)壶之简介

二 、ETL简介

ETL ( Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程) 。在企业种我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,对开发人员来说必不可少,这里我要学习的ETL工具是Kettle ! 。

三、Kettle 简介

3.1 kettle是什么?

Kettle 是一款国外的开源ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

顾名思义,Kettle 翻译为中文是水壶,寓意着把所有乱七八糟的数据放到一个壶里,最终以一种指定格式流出

快速上手kettle(一)壶之简介

3.2 kettle两种设计

快速上手kettle(一)壶之简介

快速上手kettle(一)壶之简介

  • Kettle中有两种脚本文件,transformationjobtransformation完成数据基本转换,job完成整个工作流程的控制
  • 转换是数据流,作业是步骤流
  • 作业的每一个步骤,必须等待前面的步骤执行完,后面的步骤才会执行。
  • 转换会一次性把所有控件都启动(一个控件对应一个线程)
  • 数据流会从第一个控件开始,一条记录一条记录的流向最后控件

3.3 kettle核心组件

外国人起名字挺有意思的,kettle的核心组件就是一套烹饪厨具。kettle的作者应该是一位吃货 (●'◡'●)

快速上手kettle(一)壶之简介

3.4 kettle 优点

快速上手kettle(一)壶之简介

四、Kettle安装

4.1 下载地址

① 官网地址

https://community.hitachivantara.com/docs/DOC-1009855

官网地址国内下载可能很慢很慢,小伙伴们可以通过以下国内镜像地址下载

②国内镜像地址
http://mirror.bit.edu.cn/pentaho/Pentaho 8.2/client-tools/

4.2 kettle目录及文件介绍

快速上手kettle(一)壶之简介
快速上手kettle(一)壶之简介

4.3 kettle 安装

Kettle是java开发的,所以需要安装jdk,我们这里安装经典的jdk8

至于jdk怎么安装,这里就不细说了,如果不知道的小伙伴百度即可

jdk安装完成后,我们将4.1 下载的安装包解压到自己想放置的路径即可

4.4 kettle界面介绍

双击Spoon.bat 即可打开如下界面

快速上手kettle(一)壶之简介

快速上手kettle(一)壶之简介

快速上手kettle(一)壶之简介

本期内容到此就结束了 (●'◡'●)

下一篇:快速上手kettle(二):kettle初体验文章来源地址https://www.toymoban.com/news/detail-459137.html

到了这里,关于快速上手kettle(一)壶之简介的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 快速上手 SpringBoot 单元测试

    ✏️作者:银河罐头 📋系列专栏:JavaEE 🌲 “种一棵树最好的时间是十年前,其次是现在” 单元测试(unit testing),是指对软件中的最⼩可测试单元进⾏检查和验证的过程就叫单元测试。 1.可以⾮常简单、直观、快速的测试某⼀个功能是否正确。 2.可以跳过项目里的其他模

    2024年02月13日
    浏览(32)
  • RabbitMQ快速上手及讲解

    1.1.1.1 异步处理 场景说明: 用户注册后,需要发注册邮件和注册短信,传统的做法有两种 1.串行的方式 (1)串行方式:将注册信息写入数据库后,发送注册邮件,再发送注册短信,以上三个任务全部完成后才返回给客户端。这有一个问题是,邮件,短信并不是必须的,它只是

    2024年02月10日
    浏览(28)
  • 5 python快速上手

    常见的数据类型: int,整数类型(整形) bool,布尔类型 str,字符串类型 list,列表类型 tuple,元组类型 dict,字典类型 set,集合类型 float,浮点类型(浮点型) 每种数据类型都有自己的特点及应用场景,以后的开发中需要根据实际的开发情况选择合适的数据类型。 每种数

    2024年01月21日
    浏览(37)
  • 快速上手Git

    简介 全宇宙最好的版本管理没有之一(Boss) 作者:linus ,linux系统的创始人 解决的问题:代码的版本管理,团队分工协作,通俗一点毕业论文最好版之毕业论文打死不改版之毕业论文日期版,A做好,让B做 必须等A git常见命令 git核心概念 工作区(写代码的文件夹) 暂存盘

    2023年04月17日
    浏览(23)
  • React学习——快速上手

    https://php.cn/faq/400956.html 1、可以手动使用npm来安装各种插件,来从头到尾自己搭建环境。 如: 2、脚手架 create-react-app https://react.dev/learn/tutorial-tic-tac-toe 官方文档的井字游戏案例 1、分解组件 2、构建静态版本 可以“自上而下”地构建组件,从层次结构中较高的组件开始构建,

    2024年02月22日
    浏览(30)
  • 【STL】vector快速上手

    目录 一,vector的模板特性 二,vector基本使用 1. 构造函数 2. operator=  赋值 3. vector——增删 A,  尾插 尾删  B,insert C,  erase  4. 访问vector 遍历vector中元素: 法一:数组[]法  || at法 法二:迭代器法 语法糖——for  三,应用 1. 排序 2. vector + string       STL中的vector是一个动态

    2024年02月15日
    浏览(25)
  • 带你快速上手HetuEngine

    本文分享自华为云社区《【手把手带你玩转HetuEngine】(一)HetuEngine快速上手》,作者:HetuEngine九级代言。 HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎。与大数据生态无缝融合,实现海量数据秒级交互式查询;支持跨源跨域统一访问,使能数据湖内、湖间、

    2024年02月12日
    浏览(27)
  • kafka使用教程、快速上手

    Kafka 是一个分布式的基于发布 / 订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 1.2.1 传统消息队列的应用场景 使用消息队列的好处: 解耦 允许独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。 可恢复性 系统的一部分组件失效时

    2023年04月14日
    浏览(37)
  • GN快速上手

    最近在研究鸿蒙操作系统的开源项目OpenHarmony,该项目使用了GN+Ninja工具链进行配置,编译,于是开始研究GN如何使用。 本文的所有信息均来自GN官网和本人个人体会。 GN的主要功能是根据配置文件(.gn, BUILD.gn等)生成build.ninja文件。build.ninja类似于Makefile,不同的是由Ninja负责

    2024年02月13日
    浏览(33)
  • Flink---1、概述、快速上手

    Flink的官网主页地址:https://flink.apache.org/ Flink的核心目标是 “数据流上有状态的计算” (Stateful Computations over Data Streams)。 具体说明:Apache Flink是一个 “框架和分布式处理引擎” ,用于对 无界 和 有界数据流 进行 有状态 计算。 1.1.1 无界数据流 有定义流的开始,但是没有定

    2024年02月09日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包