WhaleScheduler为银行业全信创环境打造统一调度管理平台解决方案

这篇具有很好参考价值的文章主要介绍了WhaleScheduler为银行业全信创环境打造统一调度管理平台解决方案。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

项目背景

数字金融是数字经济的重要支撑和驱动力。近年来,我国针对数字金融的发展政策频频出台,《金融科技发展规划 (2022-2025年)》、《“十四五”数字经济发展规划》、《关于银行业保险业数字化转型的指导意见》、《金融标准化“十 四五”发展规划》等相继发布,顶层设计逐步完善。

2024年,政府工作报告也提出要大力发展科技金融、绿色金融、 普惠金融、养老金融、数字金融,未来数字金融是我国金融发展重点之一。

我国金融业正在步入数字化转型的关键阶段,同时在发展中面临着诸多挑战与难点,如数字基础设施建设不足、数字安全保障机制不健全等。

某国有银行地区性分行(以下简称“银行”)主动融入数字经济新浪潮,抢抓机遇、乘势而上,不断深化数字化转型升级,积极加快金融产品融合创新,但是在发展中仍面临显著困难。

痛点与挑战

具体到业务上,银行需要对总行分发的数据进行加载和转换,每日任务约 3000。随着新业务不断增加,任务总量在 1 万左右。银行的业务场景涉及到接收上游系统提供的文件数据,并将数据导入到 GreenPlum 等分析数据库中进行数据分析。此前,银行使用自研的调度系统来进行任务的调度,但随着数据量急剧增长和全新业务场景的出现,这个调度系统陈旧、性能不够的缺点暴露出来。

总的来说,银行在数据调度上面临着以下痛点问题:

  1. 前期自研系统系统灵活性较差,系统维护工作量巨大,跑批出现问题时对业务正常开展产生影响的风险较大,且对于新支持新增业务的需求,需要投入研发人员定制开发;
  2. 不支持分布式系统,扩展性能差,面对急剧增长的数据量无法快速完成扩容;
  3. 业务方涉及不同部门,对程序理解不同,使用习惯也不同,难以满足所有业务部门的使用需求;
  4. 上游文件数量多,来源广,并且到达时间不定,需要随时监控数据到达情况,并在发生异常情况时及时发出告警;
  5. 跨部门使用场景多,需要跨项目依赖和准确的影响分析查询,便于追溯完整的上下游关系;
  6. 多业务部门使用调度时,无法高效复用已有调度,并限制相关权限;
  7. 银行对于信创环境支持的需求越来越紧迫,但苦于原系统无法进行改造以支持信创操作系统、信创服务器、信创数据库等信创环境。

项目需求

银行将紧跟总行的企架各批次分行特色系统建设计划,推进信创化建设,并发挥科技赋能作用。目标是满足公司数据体系建设中数据处理任务的统一调度和监控需求,同时推动建设信创下的统一调度管理平台。

为了实现这一目标,银行将建立每日流水线任务的集中定义和集中控制机制,允许用户灵活地配置多种类型的作业任务,并统一调度和监控运维。这个统一调度管理平台需要具备高性能、高可靠性,同时易于扩展的特点,以满足银行在多样化功能上的开发需求。

最重要的是,流水线任务统一调度管理平台使银行能够全面监控和跟踪管理各数据加工节点的处理过程,帮助银行更有效地管理数据处理任务,实现对任务的全面掌控。

针对这些需求,调度系统需要满足以下要求:

  • 支持分布式的架构及资源控制等方法,实现高可靠性,高处理性能。

  • 支持多种丰富的任务类型,包括Shell、MR、Spark等。

  • 具有良好的管理接口,易于管理,达到简单易用,使得用户有流畅的产品体验。

  • 提供强大的任务执行功能,支持指定任务的运行、空跑测试功能等能力。

  • 提供参数管理和数据源的统一维护能力及日历管理能力和工作流配置管理能力。

  • 提供完善的监控和告警能力,支持工作流和任务的运行情况统计和监控、任务日志在线查看、服务器资源监控、数据质量检测和告警。

  • 提供监控和统计以及权限管理功能,支持统一的数据监控、运维服务需求等。

除此之外,调度系统还需要支持用户的个性化需求,比如通过产品的多样化结构配置,满足对接银行行内登录、权限组件、短信接口、行信接口、个性化展示页面,以及20条存量工作流迁移等工作需求。

WhaleScheduler解决方案

白鲸开源自主研发的WhaleScheduler国产信创化调度平台可支持银行在数据体系建设中不同场景的任务调度需求,满足金融行业企业级用户对系统的稳定性、可靠性、合规性、高性能、支持信创环境等要求。WhaleScheduler为银行批处理任务制定统一的开发规范、运维方法,对各系统的批量任务进行统一管理、调度和监控,符合银行不同业务应用环境的性能需求,并提供了私有化部署和开发支持。

01 无中心化架构设计

白鲸开源WhaleScheduler采用先进的无中心架构的设计思想,通过注册中心发现服务,服务之间可以互为备份,保证了系统的高可靠性的同时,也可以做到水平扩展服务数量,以保持银行业务的稳定性,很好地支持千万级别的任务数量。

WhaleScheduler 架构图

02 分布式部署

WhaleScheduler为银行提供的所有服务均采用分布式部署,支持高稳定性、高性能和高容错性,保证提供可持续使用的服务。

集群部署架构图

03 多种任务类型

WhaleScheduler支持包括Shell、MR、Spark、SQL(MySQL、PostgreSQL、Hive、SparkSQL)、Python、Sub_Process、Procedure等任务类型,同时具备跨项目依赖和补数功能。

04 全模式DAG开发能力

系统采用全“所见即所得”设计模式,用户可以通过拖拽,快速生成复杂的DAG任务工作流,而无需掌握大量代码和大数据底层知识。

05 强大的任务执行功能

支持指定任务的运行、空跑测试功能,支持日期参数的输入,支持多个前置任务状态的逻辑判断或前置任务的输出参数判断,支持SSH远程登录目标服务器并在其上执行任务等能力。

06 丰富的工作流配置管理能力

支持工作流Excel文件的导入导出、模板与实例分离、多种环境运行任务、灵活的参数定义和传参功能,以及工作流详情展示和多种运行策略。

07 监控本地/远程服务器文件

系统通过Trigger任务类型支持监控本地/远程服务器文件到达事件、数据库条件成立事件,并提供全局Dashboard,项目Dashboard,支持工作流和任务的运行情况统计和监控、任务日志在线查看、服务器资源监控,数据质量检测,以及邮件、钉钉、企业微信、HTTP、脚本等十余种告警方式,自定义告警类型也可以轻松做到。

08 多样化的日历功能

WhaleScheduler提供强大的日历管理功能,支持不同项目配置独立的日历。可视化日历配置和模板导入导出的维护方式对于银行工作人员的用户体验来说也是非常友好的,创建、编辑、删除、导入导出等操作方式一目了然。如果有需要,用户还可以按日历进行调度,也可以基于日历或翻牌任务获取日期数据。

09 任务级血缘分析

银行跨部门的使用场景需要跨项目依赖和准确的影响分析查询,这一点非常重要。对此,WhaleScheduler提供了完善的系统影响分析功能,可以分析任务级的血缘,血缘分析包括工作流、任务,工作中的子流程,以及子流程中嵌套的依赖等,让用户可以查看完整的任务上下游关系。

10 数据质量检测

银行的上游数据类型多,来源复杂,数据质量检测是重要的一环。WhaleScheduler支持数据质量检测,检测规则包括不限于空值检测、枚举值检测、表行数校验、两表值比对校验等检测规则。如果检测错误的数据条数超过阈值,需要告警出来或者工作流失败停止,用户可以设置超过阈值告警或让工作流失败。

11 用户角色菜单权限管控

支持用户操作审计,设置用户、角色、资源、权限来设计不同部门的功能权限,满足银行对安全与权限的特殊需求。

12 高可伸缩性支持

调度集群能够随任务量的增加及时增加资源,持续提供服务。

13 任务维护人员配置

系统设计有完整的用户管理体系,可以进行任务维护人员的添加、修改和删除等配置图片

同时,针对银行提出的个性化功能开发,包括对接行内登录、权限组件、短信接口、行信接口、个性化展示页面以及20条存量工作流迁移等工作和现场安装、调试等工作,白鲸开源派出项目经验丰富的团队,采用符合PMI标准的项目管理制度,以满足银行不同业务应用环境对性能的需求。

白鲸开源WhaleScheduler为银行提供了高可靠性、高性能、多场景支持、支持全站华部署运行的强大调度功能,不但可以到银行各规模、各层次的高可靠性、高安全性、可扩展性和可管理性的要求,还充分考虑到银行未来3-5年的发展需要,可适应银行不断发展的业务和管理需求。

白鲸开源

白鲸开源科技是一家由多名 Apache Software Foundation Member, Apache DolphinScheduler 和 Apache SeaTunnel 核心成员组建的公司。我们致力于打造下一代云原生 DataOps 平台,助力企业在大数据和云时代,智能化地完成海量数据的处理、调度和治理,以提高企业解决数据问题的效率,提升企业分析洞察能力和决策能力。

本文由 白鲸开源 提供发布支持!文章来源地址https://www.toymoban.com/news/detail-855113.html

到了这里,关于WhaleScheduler为银行业全信创环境打造统一调度管理平台解决方案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 重磅!金融监管总局出台《银行保险机构数据安全管理办法》!金融行业安全迎来新变革?

    为规范银行保险机构数据处理活动,保障数据安全,促进数据合理开发利用,稳步提升金融服务数字化、智能化水平,保护个人和组织的合法权益,2024年3月22日金融监管总局制定并发布了 《银行保险机构数据安全管理办法(征求意见稿)》 (以下简称《办法》)。 《办法》

    2024年04月27日
    浏览(31)
  • 易观千帆 | Q1运营报告:手机银行MAU超5.3亿,行业“内卷”超出想象

    易观: 由中国电子银行网、易观分析联合发布的“2023中国手机银行综合运营报告”显示:在经济企稳回升的大背景下,中国手机银行第一季度综合运营指数季度内呈平稳上升态势,手机银行活跃人数环比增幅逐月递增,促使活跃用户规模增速较快。数据显示,一季度手机银

    2024年02月10日
    浏览(28)
  • 化工行业供应商协同管理系统:助力企业打造良好营商环境,提升运营效率

    化工行业是我国工业发展的重要基础,也是国民经济发展和生活不可或缺的一部分。化工产品的更新换代,产业的不断升级,对原材料的采购也提出了更高要求。 由于精细化工行业原材料的质量和成本,与供应商的选择与资质具有重要的关联性,提高供应商的管理质量对化工

    2024年01月25日
    浏览(32)
  • 如何打造元宇宙中的数据银行DataRights

    互联网时代的流量,人与人之间的关系是非线性的,不确定的,没有因果链,所以需要大数据中的Al从不确定性中寻找确定性,即模式识别,再从中转化商业机会。最终,掌握大数据和商业模式识别机会的平台(互联网巨头)获得了对民众生杀予夺的权力。 数字网络Web3时代的

    2024年02月11日
    浏览(29)
  • 打造区块链行业数据聚合边框

    低调的数据地带 目前,区块链行业正以迅猛的速度在全力发展,衍生出许多的赛道。假如把区块链比作一副白纸,作为以挖矿、底层公链领域属于整个区块链金字塔顶端,各部交易所属于中部链接,连接上下游,下游则属于各类衍生品,如币种项目、NFT、Defi、gamefi、钱包等

    2024年02月02日
    浏览(29)
  • 行业报告|3D感知技术快速发展,打造“机器之眼”,助推各行业加速升级!

    原创 | 文 BFT机器人  01 3D视觉感知全栈式平台,硬核实力蓄势待发 1.1 3D视觉感知为“机器之眼”,未来市场空间广阔 3D视觉感知技术充分弥补了2D成像技术的以上不足,可获取空间几何尺寸信息。 过去数十年2D成像技术蓬勃发展,分辨率从几十万像素发展到现在的上亿像素,

    2024年02月10日
    浏览(26)
  • 冶金行业渠道商经销管理系统统一渠道商监管,提高企业管理效率

    冶金是从矿物中提取金属或者金属化合物﹐经过加工方法将金属制成具有一定性能的金属材料。冶金具有悠久的发展历史﹐从石器时代到随后的青铜器时代﹐再到近代钢铁冶炼的大规模发展。随着冶金工业的发展速度迅速提高﹐行业规模也不断扩大﹐竞争逐渐加剧﹐企业开始

    2024年02月09日
    浏览(27)
  • 星起航:跨境电商行业卖家可利用新技术打造成熟供应链

    近年来,跨境电子商务作为一种新兴业态发展强劲,已成为我国外贸经济增长的重要支柱。尤其是2020年初以来,本已承压的外贸经济突然遭遇全球性疫情,使得一般贸易损失惨重。依托当前的物流体系,跨境电商打破了物理空间壁垒,展现了独特的发展优势,实现了逆势增长

    2024年02月11日
    浏览(28)
  • 打造创新的金融数据平台,加速数字化和智能化转型丨PingCAP 官网金融行业专区上线

    自诞生以来,TiDB 的原生分布式架构在强一致性、高可用性和可扩展性等方面与金融级业务需求高度契合,早期版本即为包括北京银行在内的金融用户提供服务。 TiDB 的核心能力始终源自与中国金融用户的共同创造。作为金融级分布式数据库,TiDB 在国有大行 PB 级别的数据服

    2024年02月01日
    浏览(49)
  • 【虚拟环境】本地环境与线上开发环境如何统一【3/3】

    1.假设我们在本地开发环境,准备好了项目+依赖包环境 2.现在需要将项目上传至服务器,上线发布 3.那么就要保证服务器的python环境一致性 解决方案: 1.通过命令保证环境的一致性,导出当前python环境的包 这将会创建一个 requirements.txt 文件,其中包含了当前环境中所有包及

    2024年01月18日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包