用Kettle调用Restful API 接口

这篇具有很好参考价值的文章主要介绍了用Kettle调用Restful API 接口。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言
作为一名架构师,在带领团队进行项目开发时,笔者认为一定要遵循一个原则:能借助第三方工具解决的开发任务,尽量用工具解决,以此来减少开发量,这样不但能够提高团队的工作效率,便于项目及时交付,也能在开发人员数量一定的条件下,更容易把余下的开发工作做好,也更容易提高代码质量,提高软件的稳定性。这对于交付项目,交付合格的软件产品是有好处的。
本文探索的内容正是用kettle这个ETL工具来调用Restful API,解决数据采集的问题。这样利用成熟的开源工具通过配置参数,就能调用接口,进行数据采集,相比安排开发人员编写代码,调试,代码提交,安排人员部署,测试人员测试,管理人员代码审核……,提高的工作效率是几何级的。如有赞同笔者观点的,请点个赞,谢谢!

1 概述
kettle 中文名称叫水壶,是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。当然它也可以用来调用Restful API 来采集数据,本文讲述的就是如何用kettle 调用Restful API,采集数据。
2 控件介绍
首先介绍一下本项目中用到的组件:
※生成记录:主要设置一些ETL转换中用到的一些变量及其值。
※REST Client:访问Restful接口的控件。
※JSON input:主要是对JSON格式的数据源进行解析。
※字段选择:选择挑选ETL转换中一些字段,起到过滤的作用。
※生成随机数:生成随机数的控件。
※表输出:表输出控件是向数据库的表中写入数据的控件。
3 主要思路
基于组件REST Client 请求 Restful API ,先访问获取token的Restful API,在得到包含token的结果集后,再用组件JSON input 从中抽取token,然后再用另一个组件REST Client 携带得到的token,访问包含业务数据的Restful API,经组件字段选择过滤后,再经组件表输出,将数据写入目标数据库对应的表。
4 应用场景
在数据ETL过程中,需要调用对方接口来获取数据,并向自己的数据库中插入大量业务数据的场景。
5 准备工作
※建一个数据库,并建一个目标表,表中要包含抽取的字段。
※准备一个postman工具来配合接口测试,验证接口是否能正常调用。
以下为二个测试接口样例:
1) 获取token接口
※ URL: http://...:9080/auth/bizlogin
※ 请求方式:POST
※ 请求参数格式:JSON
※ 请求参数:
{
“username”:“134********”,
“password”:“123456”
}
※ 返回参数格式:JSON
※ 返回参数:
{
“code”:200,
“msg”:null,
“data”:{
“token”:“5092db2c-f126-40bd-b699-bfcc1634d9b6”,
“userid”:12,
“username”:“134********”,
}
}
kettle调用api,java,算法,大数据,restful,java,postman

2) 业务接口
※ URL: http://...:9080/biz/cocUser/userInfo?userId=12
※ 请求方式:GET
※ 请求参数格式:URL中携带请求参数
※ 请求参数:
userId
※ 返回参数格式:JSON
※ 返回参数:
{
“code”:200,
“msg”:“成功!”,
“data”:{
“userId”:11,
“userName”:“mx”,
“cellphoneNumber”:“134********”,
“email”:“hel**********@126.com”,
“createTime”:“2022-12-25 10:06:55”,
“updateTime”:null,
“auditing”:0,
“status”:0
}
}
如图:

kettle调用api,java,算法,大数据,restful,java,postman
6 最终页面效果图
kettle调用api,java,算法,大数据,restful,java,postman
7 操作步骤
7.1 第1步
启动spoon,新建一个转换,拖入1个生成记录,1个REST Client(命名为” REST Client获取token”),1个JSON input(命名为“JSON input_token”),1个字段选择(命名为“字段选择(token)”),再拖入一个REST Client(命名为” REST client(获取业务信息)”),再拖入一个JSON input(命名为“JSON input_userinfo”),再拖入1个字段选择(命名为“字段选择(过滤字段)”),拖入一个生成随机数,再拖入一个表输出,则完成全部控件的拖入。如图所示:
kettle调用api,java,算法,大数据,restful,java,postman
7.2 第2步
双击组件生成记录,然后填入下面三个参数,即前面的接口访问路径及接口参数:
kettle调用api,java,算法,大数据,restful,java,postman
如图:
kettle调用api,java,算法,大数据,restful,java,postman

将生成记录与REST client(获取token)关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.3 第3步

双击组件REST Client,然后填入下面参数,见下图:
kettle调用api,java,算法,大数据,restful,java,postman
将REST client(获取token)与JSON input _token关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.4 第4步

双击JSON input _token,输入如下参数,如图:

kettle调用api,java,算法,大数据,restful,java,postman
切换到“字段”页面,并填入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman
将JSON input _token 与字段选择(token)关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.5 第5步
双击组件字段选择(token),并填入相应参数,如图:

kettle调用api,java,算法,大数据,restful,java,postman
将字段选择(token)与REST client(获取业务信息)关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.6 第6步

双击组件REST client(获取业务信息),并填入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman
切换到Headers页面,输入Authorization 和 token,如图:
kettle调用api,java,算法,大数据,restful,java,postman
将组件REST client(获取业务信息)与JSON input_userinfo关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman

7.7 第7步
双击组件JSON input_userinfo,并填入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman
切换到“字段”页面,并填入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman
注:如果上面图片看不太清楚,请参考下面例子,路径的输入要正确:
名称:userId 路径:$…data.userId 类型 :integer

将JSON input_userinfo 与字段选择(过滤字段)关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.8 第8步

双击组件字段选择(过滤字段),并填入相应参数,如图:

kettle调用api,java,算法,大数据,restful,java,postman
切换到元数据页面,并输入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman

将字段选择(过滤字段)与生成随机数关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.9 第9步

双击组件生成随机数,并输入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman
将组件生成随机数与组件表输出关联,如图:
kettle调用api,java,算法,大数据,restful,java,postman
7.10 第10步
双击组件表输出,并填入相应参数,如图:
kettle调用api,java,算法,大数据,restful,java,postman

先勾选“指定数据库字段”,并切换到“数据库字段”页面,点击“获取字段”,编辑或输入相应参数(注:要区分表字段和流字段),如图:

kettle调用api,java,算法,大数据,restful,java,postman
7.11 第11步
点击运行转换按钮,运行后,各个节点均绿色并打钩状态,如图:
kettle调用api,java,算法,大数据,restful,java,postman
打开数据库对应的表,发现数据已导入,如图:
kettle调用api,java,算法,大数据,restful,java,postman
至此,经过上面的11个步骤,完成了kettle对Restful API的调用。文章来源地址https://www.toymoban.com/news/detail-791062.html

到了这里,关于用Kettle调用Restful API 接口的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 通过API接口调用数据的优势是什么?API接口调用展示示例

    通过API接口调用数据的优势主要有以下几点: 1.规范化与一致性:API接口提供一种统一的方式来获取数据,保证了数据的规范化与一致性,消除了不同数据源可能带来的格式和结构上的差异。 2.灵活性:使用API接口可以定制请求的参数和返回结果,让请求方可以得到所需的数

    2024年02月06日
    浏览(51)
  • 无需编程,基于微软mssql数据库零代码生成CRUD增删改查RESTful API接口

    通过之前一篇文章 无需编程,基于甲骨文oracle数据库零代码生成CRUD增删改查RESTful API接口 的介绍,引入了FreeMarker模版引擎,通过配置模版实现创建和修改物理表结构SQL语句,并且通过配置oracle数据库SQL模版,基于oracle数据库,零代码实现crud增删改查。本文采用同样的方式,

    2024年02月05日
    浏览(45)
  • 课程8:RESTful风格API接口

    2023年05月11日
    浏览(44)
  • 淘宝详情API接口文档(java)get调用

    淘宝详情API接口是用于获取淘宝商品详细信息的接口,它允许开发者通过发送请求,获取商品的描述、价格、评价等信息。下面是一个关于淘宝详情API接口的示例文档,包括接口地址、请求参数、响应参数等内容。 淘宝详情API接口文档 一、接口地址 二、请求参数 三、请求示

    2024年04月11日
    浏览(37)
  • API商品数据接口调用爬虫实战

    随着互联网的发展,越来越多的商家开始将自己的商品数据通过API接口对外开放,以供其他开发者使用。这些API接口可以提供丰富的商品数据,包括商品名称、价格、库存、图片等信息。对于爬虫开发者来说,通过调用这些API接口,可以更加便捷地获取商品数据,避免了爬取

    2024年02月07日
    浏览(40)
  • Java调用ChatGPT的API接口实现对话与图片生成

    有些魔法是需要做配置的。否则无法正确实现代码测试。这里以我使用的工具为例说明。 在pom.xml文件中添加: Constants类中,声明自己的API Key 其中,查看API Key的位置: https://platform.openai.com/account/api-keys 余额查询: https://platform.openai.com/account/usage pom.xml文件中需要增加依赖:

    2024年02月07日
    浏览(53)
  • 使用curl和postman调用Azure OpenAI Restful API

    使用curl在cmd中调用时,注意:json大括号内的每一个双引号前需要加上\\\'\\\'    使用postman或getman.cn调用,则不需要    在header中配置如下  

    2024年02月05日
    浏览(49)
  • 如何利用python调用API接口获取数据进行测试

    一、Python 可以使用 requests 库来调用 API 接口获取数据。以下是基本的步骤: 1.安装 requests 库 pip install requests 2.导入 requests 库 import requests 3.构建 API 请求的 URL 根据 API 文档,构建请求的URL。 例如,  https://api.example.com/posts  是获取所有帖子的 URL。 4.发送 API 请求 使用  requ

    2024年02月11日
    浏览(46)
  • Nginx反向代理的一个算法API的接口调用超时:504,GateWay Timeout,怎么破?

    服务端由第三方部署了一个基于 darknet (一个较为轻型的完全基于C与CUDA的开源深度学习框架)的识别算法服务,通过 Flask 的 Web 服务对业务服务暴露 API 接口。作为测试,一开始是直接通过 python3 app.py 的命令行启动的服务,然后在 Nginx 处通过反向代理过来的。 可是在通过前

    2023年04月08日
    浏览(83)
  • PHP调用淘宝app商品详情原数据 API 接口

    作为互联网企业,调用淘宝APP中的数据是非常常见的。那么如何调用呢? taobao.item_get_app 公共参数 请求地址:申请调用地址 名称 类型 必须 描述 key String 是 调用key(点*击*注*册*免*费*调*用) secret String 是 调用密钥 api_name String 是 API接口名称(包括在请求地址中)[item_search

    2023年04月24日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包