数据仓库解决方案——ODPS组件化改造之路

这篇具有很好参考价值的文章主要介绍了数据仓库解决方案——ODPS组件化改造之路。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

场景还原


不知道你是否在写离线代码时遇到过以下几种情况:

  • 相同的业务代码逻辑分散在各个地方,需要维护多份相似功能代码;

  • 存在多张相同结构的表输入,需要经过相同或相似的逻辑计算加工,并输出给下游表;

  • 有一个计算逻辑非常复杂,需要经过多个子流程或多个节点处理,如何理清楚这些这些节点的逻辑和层次关系?

这里举几个场景,好让你更形象地理解。

  1. 在某个系统中,数据分大促活动数据和日常数据。大促活动数据优先级较高,需要每小时地调度计算,日常数据优先级较低,只需要天级调度。PS:在这个场景中,我们处理这些数据的逻辑高度地相似甚至相同,并且输入表和输出表的schema也是一样的,唯一不同的是调度周期。

  2. 在某系统中需要统计分析不同维度下的销售数据,比如城市、省份、时间段(天、周、月)、区域等等

  3. 某平台需要给多个业务输出数据,希望不同业务间的数据做隔离,一个业务只能读取本业务范围内的数据。

不知道现在有没有体感了,如果有了,请继续往下看。


解决思路



其实以上问题归根结底,我们需要有一套代码模板来实现代码的复用,我们可以通过参数的控制实现差异化的功能。

开始,笔者想到的是通过Java后台来生成这套模板代码,然后在ODPS 上创建Python脚本,通过Http请求Java后台的服务,以动态脚本的方式离线调度执行。

但很快发现这种方式存在诸多问题:

  • 代码在JAVA侧,JAVA侧拼接SQL极易出错,需要经常发布JAVA应用来实现某个离线小功能的迭代,并且离线代码侵入后台系统本身也不太合理。

  • SQL是动态生成的,缺少代码格式化,只能通过运行日志找到实际运行的代码,可读性差。

  • 代码存在两个系统中,较为黑盒,代码测试和debug都较为困难。

最后,在翻阅ODPS的官方文档后发现,其实这些问题ODPS平台上已经具备相应的解决方案了——ODPS组件。

初识ODPS组件

============


▐  组件的定义

组件是一种带有多个输入参数和输出参数的SQL代码过程模板, SQL代码的处理过程一般是引入一到多个源数据表,通过过滤,连接,聚合等操作,加工出新的业务需要的目标表。

****▐  组件的价值

如上,在实际业务实践中,有大量的SQL代码过程很类似,过程中输入的表和输出的表的结构是一样的或者是类型兼容的,仅仅是名字不同而已。这个时候组件的开发者就可以将这样的一个 SQL 过程抽象成为一个SQL组件节点,将里面可变的输入表抽象成输入参数,把里面可变的输出表抽象成输出参数,就可以实现 SQL 代码的复用。

组件的使用者在使用 SQL 组件节点的时候,只要从组件列表中选择和自己业务处理过程类似的组件,为这些组件配置上自己业务中特定的 输入表和输出表,不用再重复复制代码,就可以直接生成新的组件 SQL 节点 从而极大提高了开发效率,避免了重复开发。

SQL 组件节点生成后的发布,调度的操作方法都和普通的 SQL 节点的操作方式是一样的。

▐  组件的结构

一个组件就像一个函数的定义一样,由输入参数,输出参数和组件代码过程构成。

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

组件的输入参数

组件的输入参数具有参数名,参数类型,参数描述,参数定义等属性, 参数类型有两种:一个是表类型 table,一种是字符串类型 string。

✎  表类型的参数

指定组件过程中要引用到的表,在使用组件的时候,组件的使用者可以为该参数填入其特定业务需要的表。

  字符串类型的参数

指定组件过程中需要变化的控制参数,比如指定过程的结果表只输出每个区域的头 N 个城市的销售额,这个 n 是 1 还是 3 就可以通过字符串类型的参数进行控制;另一个例子,要指定过程的结果表输出那个省份的销售总额,可以设置一个省份字符串参数,指定不同的省份,就能获得指定省份的销售数据。

  组件的输出参数

组件的输出参数具有参数名,参数类型,参数描述,参数定义等属性,参数类型只有一种:表类型 table。字符串类型的输出参数没有逻辑意义。

  组件的过程体

在过程体中参数的引用格式为:@@{参数名}

过程体通过编写抽象的sql 加工过程,将指定的输入表按照输入参数进行控制加工出有业务价值的输出表。

PS:其实作为码农,我们能很好地理解组件的概念,因为即使你没写过ODPS代码,不知道ODPS的组件,但你一定在你曾经用过的语言里找到类似的概念,例如,前端领域中的UI组件,移动Android开发中的组件,Java开发中的各种框架,Jar包等等都是一些组件。

===

牛刀小试

========


作为初识ODPS组件的小白,我们先尝试写一个helloword,实现从一张大表中按业务拆分出多张子表,分别给到各自业务各自的表。

▐  创建组件

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

过程体开发

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

PS: 组件过程的开发具有一定的技巧,组件过程的代码需要巧妙的利用输入参数和输出参数,使得组件过程能够在使用的时刻填入不同的输入参数和输出参数也能生成正确的可运行的sql代码。

填写输入输出参数

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

调试&运行

在做完以上两步后,我们可以直接在组件开发的界面点击运行,输入测试的参数进行调试运行。

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

发布

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

组件具有版本号的功能,每次发布,版本号会自增,后面组件使用的地方会用到。

▐  组件引用

在数据开发页面,在文件夹目录先右键选择创建SQL组件节点。

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

使用组件节点与SQL节点,大部分开发使用习惯都是一样的,包括调度配置也都一样,唯独不同的是组件节点关联了一个组件,如果需要更新节点,需要先更新组件的代码,然后更新节点的代码版本。

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

进阶使用

========


自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

Spring全套教学资料

Spring是Java程序员的《葵花宝典》,其中提供的各种大招,能简化我们的开发,大大提升开发效率!目前99%的公司使用了Spring,大家可以去各大招聘网站看一下,Spring算是必备技能,所以一定要掌握。

目录:

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

部分内容:

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

Spring源码

  • 第一部分 Spring 概述
  • 第二部分 核心思想
  • 第三部分 手写实现 IoC 和 AOP(自定义Spring框架)
  • 第四部分 Spring IOC 高级应用
    基础特性
    高级特性
  • 第五部分 Spring IOC源码深度剖析
    设计优雅
    设计模式
    注意:原则、方法和技巧
  • 第六部分 Spring AOP 应用
    声明事务控制
  • 第七部分 Spring AOP源码深度剖析
    必要的笔记、必要的图、通俗易懂的语言化解知识难点

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

脚手框架:SpringBoot技术

它的目标是简化Spring应用和服务的创建、开发与部署,简化了配置文件,使用嵌入式web服务器,含有诸多开箱即用的微服务功能,可以和spring cloud联合部署。

Spring Boot的核心思想是约定大于配置,应用只需要很少的配置即可,简化了应用开发模式。

  • SpringBoot入门
  • 配置文件
  • 日志
  • Web开发
  • Docker
  • SpringBoot与数据访问
  • 启动配置原理
  • 自定义starter

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

微服务架构:Spring Cloud Alibaba

同 Spring Cloud 一样,Spring Cloud Alibaba 也是一套微服务解决方案,包含开发分布式应用微服务的必需组件,方便开发者通过 Spring Cloud 编程模型轻松使用这些组件来开发分布式应用服务。

  • 微服务架构介绍
  • Spring Cloud Alibaba介绍
  • 微服务环境搭建
  • 服务治理
  • 服务容错
  • 服务网关
  • 链路追踪
  • ZipKin集成及数据持久化
  • 消息驱动
  • 短信服务
  • Nacos Confifig—服务配置
  • Seata—分布式事务
  • Dubbo—rpc通信

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

Spring MVC

目录:

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

部分内容:

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

数据仓库解决方案——ODPS组件化改造之路,程序员,数据仓库,odps,python

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
[外链图片转存中…(img-oMRpfL1o-1713710074339)]

Spring MVC

目录:

[外链图片转存中…(img-kjRT6HxX-1713710074340)]

[外链图片转存中…(img-iDewIqJH-1713710074340)]

[外链图片转存中…(img-xzBXfc9o-1713710074340)]

部分内容:

[外链图片转存中…(img-XXpkvjhq-1713710074340)]

[外链图片转存中…(img-zz8Kb2nP-1713710074340)]

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!文章来源地址https://www.toymoban.com/news/detail-860790.html

到了这里,关于数据仓库解决方案——ODPS组件化改造之路的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【docker】设置 docker 国内镜像仓库报错,解决方案

    daemon.json 格式错误 配置冲突 ,如 daemon.json 和 docker.service 中同时配置了同一个参数 1. 删除 daemon.json 或者 重命名成 daemon.conf ( 不推荐,效果相同 )          全网很多博主的解决方案是重命名成 daemon.conf,但是通过docker info查看发现,配置并未生效 2. 复制标准的 daemo

    2024年02月05日
    浏览(40)
  • 智能仓储管理系统(自动化仓库管理解决方案)

            企业实际的仓储管理中,往往会出现那样这样的错误,归根结底,主要是由于没使用合适的仓库管理工具。相反,人工使用合适的仓库管理工具,不仅可以在日常仓库管理方法中根据采集到的产品信息数据,大大地提高管理效率,降低库存实际管控成本,还可降低人

    2024年02月12日
    浏览(35)
  • MVPArms官方快速组件化方案开源,来自5K star的信赖(1)

    基础库(网络请求、图片加载等)的封装 路由框架(页面跳转, 服务提供) 业务组件的划分和代码隔离 0.2.1 业务组件的划分和代码隔离 先说第三点 业务组件的划分和代码隔离 , 现在大部分的文章都围绕着这点, 我这里发表下个人的观点, 第三点确实是很重要的一点, 不管是大厂的

    2024年04月27日
    浏览(28)
  • Android组件化方案及组件消息总线modular-event实战,渣本Android开发小伙如何一步步成为架构师

    美团外卖团队开发的一款Android路由框架,基于组件化的设计思路。主要提供路由、ServiceLoader两大功能。之前美团技术博客也发表过一篇WMRouter的介绍:《WMRouter:美团外卖Android开源路由框架》。WMRouter提供了实现组件化的两大基础设施框架:路由和组件间接口调用。支持和文

    2024年04月22日
    浏览(34)
  • Android技术栈(二)组件化改造,目前最稳定和高效的UI适配方案

    .build(PR.navi.navi) .navigation(); 而 Activity 则不需要,它会立即显示 ARouter.getInstance() .build(PR.navi.navi) //还可以设置参数,ARouter会帮你存在Bundle中 .withString(“pathId”,UUID.randomUUID().toString()) //Activity 或 Context .navigation(this); navi 模块是典型的业务逻辑模块,这里你可导入一些只有这个模块才

    2024年03月24日
    浏览(35)
  • 【Git】第一次将本地项目仓库推代码到空的远程仓库方法以及报错的解决方案

    完成上述三步之后,在弹出来的对话框中选择自己的项目目录, 点确定,就可以在文件管理器中看到目录下生成了一个隐藏目录 “ .git ” 右键项目目录,找到Git,根据图示找到remote 在弹出来的对话框中,输入自己远程仓库的地址 点击ok,输入验证信息,连接完毕。 点击p

    2024年02月15日
    浏览(39)
  • GitHub提交时出现Host key verification failed无法读取远程仓库的解决方案

    今天提交代码时候发现有这样一个问题: 那么为什么呢? 找了一圈, 发现一篇帖子是最近(两天前写的)由GitHub官方给出的, 如下: We updated our RSA SSH host key; 那么, 就用这个方法试试呗: 解决了~ 重新试试提交: 当然, 我之前还试了添加ssh公钥的方法, 并不奏效, 这里也贴出来吧: (熟悉

    2024年02月11日
    浏览(26)
  • git提交到远程仓库 Git HEAD detached from origin(冲突解决后无法正常push) 问题的解决方案

    目录 一、Git提交代码的流程 二、将本地项目发布到gitee上 将本地代码库与远程代码库相关联 强制把远程仓库代码拉取到到当前分支上面。ps:如果仓库为空这一步可以跳过 三、git提交代码--修改提交的地址 四、获取密钥 Git HEAD detached from origin(冲突解决后无法正常push) 问题

    2024年02月03日
    浏览(43)
  • 在给远程仓库推送本地项目时,报错:error: No such remote ‘origin‘,解决方案

    场景:在我本地有一个项目,我想把这个项目放在我在远程创建的Git仓库里         首先我执行了推送添加的这段代码          并没有推送添加到我的指定远程仓库中,出乎意料的是报错了:error: No such remote \\\'origin\\\'           解决方案: 第一步:运行  运行完后,发现

    2024年02月12日
    浏览(45)
  • 微信小程序启用组件按需注入解决方案

    1.当使用uniapp发布微信小程序,上传到微信小程序版本库时,会检查代码,常会出现代码质量问题,如下图所示  解决方案如下 在上传代码之后,本地文件会生成unpackage文件夹,在unpackage/dist/build/mp-weixin文件夹中,找到app.json文件,在最后加入代码\\\"lazyCodeLoading\\\" : \\\"requiredCompo

    2024年02月11日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包