MRS大企业ERP流程实时数据湖加工最佳实践

这篇具有很好参考价值的文章主要介绍了MRS大企业ERP流程实时数据湖加工最佳实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本文分享自华为云社区《MRS大企业ERP流程实时数据湖加工最佳实践》,作者:晋红轻 。

本文将以ERP流程实践为例介绍MRS实时数据湖方案的演进

案例实践需求解析:

业务描述

  • AE表:会计分录表,主要记录财务相关信息,可用于成本核算等业务计算。为业务最主要的表,称驱动表。
  • 四通道表:实际为四个门店业务系统,主要记录销售记录信息。为成本核算、科目报表分析等业务提供信息佐证。可称为维表。

业务痛点

  • 科目分析报表业务供数慢的痛点,数据时延高。
  • 实际业务数据有内容更新,保证数据严格一致。
  • 科目分析报表查询仅支持公司、科目、时段等少量查询条件。

实时数据湖方案优势

  • 实时数据湖方案做增量加工,将传统供数压力卸载到每天、每小时、每分钟,100万数据查询只需要2min。
  • 使用Hudi作为数据湖天然支持数据更新。
  • 提供所有数据归档,可随时回溯。
  • 支持科目、批名、凭证名、合同号等31个查询条件,大幅度减少用户导出数据后筛选过滤时间。支持用户基于页面直接分析。

实时数据湖方案实施挑战

  • 流计算基于内存,峰值数据量过大会影响作业稳定性。
  • 多流时延大,数据等待耗费大量内存资源,需考虑业务需求与使用资源的平衡。

流加工模型一:

模型一特点

•Hudi表流读能够减少整体内存开销,提高作业稳定性。

•以其中一条流为基准(左表),去比较另一条流(右表)

•会出现关联缺失的情况,以驱动表(AE表)的视角(新增&更新)

•1)四通道流早到,并且ttl到期后数据丢失

•2)四通道流晚到,AE流ttl到期后数据丢失

模型一局限:

•目标宽表数据会出现不准的情况

•源端新增因为关联不出有效结果造成目标宽表缺数 -> missing

•源端更改因为关联不出有效结果造成目标宽表延时 -> delay

流加工模型二:

补偿目的:

补偿目的:基于业务逻辑,对比源端流表和目的端宽表数据内容,发现目标宽表缺失数据主要字段,关联源表完整内容找出缺失数据,并写回源端表补偿层。

missing&delay补偿模拟:

模型二特点:比较方案一增加补偿机制,能够对比源表(AE表,四通道表)以及目标宽表,找出缺失数据missing, delay。

模型二局限:实际情况双流之间时延可能较大、对齐较难,虽然能够使用补偿机制找回缺失数据,但是这样流加工任务主要角色会被弱化,同时会对补偿任务造成更大压力,数据时延会变大 。

流加工模型三(最终):

双写目的:业务系统持续向Hudi表,HBase表双写数据。Hudi表流读,提供主要热关联数据,HBase存储所有历史数据,技术上就是维度表,为热关联失败之后进行快速点查补数(lookup join)得到有效关联。提高双流关联的命中率。减少流加工整体数据时延。

维表选型:

模型总结:

 

点击关注,第一时间了解华为云新鲜技术~文章来源地址https://www.toymoban.com/news/detail-635451.html

到了这里,关于MRS大企业ERP流程实时数据湖加工最佳实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 亿发中小型企业erp软件智能化赋能,专业助力广东制造行业生产流程管理

    在当前经济全球化的环境下,广东省的中小型制造业企业正面临多方面的严峻挑战。包括产品质量的维护、分销渠道的稳定、生产成本降低以及减轻生产过程中的资源消耗等难题。目前,随着信息技术的迅速发展,一些先进的IT工具,比如企业资源计划(ERP)系统,为广东省

    2024年01月25日
    浏览(51)
  • 云中企业应用程序安全的最佳实践

    文章首发微信公众号:网络研究院,关注获取更多。 对于许多企业来说,将应用程序迁移到公共云是一个有吸引力的提议,可以带来很多好处。 它可以加快上市时间,企业可以在几秒钟内启动新实例或停用它们,从而使开发人员能够通过快速部署来加速开发。这支持更大的

    2024年02月10日
    浏览(37)
  • 助力企业前行——Scala&Spark最佳实践课程

    时间飞逝,转眼间我们的ScalaSpark培训课程已经圆满结束!在这段精彩的学习旅程中,你们展现了坚韧、决心和追求卓越的品质。 scala(Scalable Language)是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。以一种简洁、高级的语言将面向对象

    2024年02月03日
    浏览(33)
  • 【新知实验室 TRTC&IM】实时互动课堂最佳实践

    活动链接:https://marketing.csdn.net/p/637c852aedd21c0ef20754a7d7635e6d 活动链接:https://marketing.csdn.net/p/637c852aedd21c0ef20754a7d7635e6d 活动链接:https://marketing.csdn.net/p/637c852aedd21c0ef20754a7d7635e6d 在线上线下一体化、虚拟现实加速融合的趋势下,音视频已经演进成一种基本能力,深刻变革了社会的交

    2024年01月16日
    浏览(37)
  • 构建大型企业应用程序:Scala和Hadoop的最佳实践

    作者:禅与计算机程序设计艺术 随着大数据和云计算技术的兴起,很多大型企业正在构建面向海量数据的大型分布式应用程序。这些应用程序一般由多个独立的小模块组成,这些模块需要分布在不同的服务器上进行通信,数据需要存储到海量的磁盘和内存中,并且需要处理复

    2024年02月11日
    浏览(36)
  • 从零开始:构建企业级AI大模型的最佳实践

    随着人工智能技术的不断发展,越来越多的企业开始投入人力、物力和财力来构建自己的企业级AI大模型。这些大模型在处理大规模数据、自然语言处理、图像识别等方面具有显著优势,为企业创造了巨大的价值。然而,构建企业级AI大模型并不是一件容易的事情,需要面对许

    2024年02月21日
    浏览(45)
  • 阿里云跨境电商企业出海最佳实践及数字化解决方案

    最近阿里云推出了全球云服务器精选特惠活动,并在活动内提供了跨境电商企业出海最佳实践及数字化解决方案,用户不仅在此可以购买到各种优惠的海外轻量应用服务器和云服务器,同时还能免费查看游戏、跨境文件传输、电商行业业务及数据库上云、电商网站等最佳实践

    2023年04月21日
    浏览(37)
  • 22 条 Spring Boot 企业级最佳实践,应有尽有,建议收藏!!

    Spring Boot 是一种广泛使用且非常流行的企业级高性能框架。以下是一些最佳实践和一些技巧,我们可以使用它们来改进 Spring Boot 应用程序并使其更加高效。这篇文章会有点长,完整读完文章需要一些时间。 正确的包目录将有助于轻松理解代码和应用程序的流程。 我们可以使

    2024年02月06日
    浏览(41)
  • 从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    作者:匡大虎 安全一直是企业上云关注的核心问题。随着云原生对云计算基础设施和企业应用架构的重定义,传统的企业安全防护架构已经不能够满足新时期下的安全防护要求。为此企业安全人员需要针对云原生时代的安全挑战重新进行系统性的威胁分析并构建适合企业自身

    2024年01月25日
    浏览(45)
  • 云计算 - 以阿里云为例,企业上云策略全览与最佳实践

    云采用框架(Cloud Adoption Framework,简称CAF)为企业上云提供策略和技术的指导原则和最佳实践,帮助企业上好云、用好云、管好云,并成功实现业务目标。本云采用框架是基于服务大量企业客户的经验总结,将企业云采用分为四个阶段,并详细探讨企业应在每个阶段采取的业

    2024年03月09日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包