DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

这篇具有很好参考价值的文章主要介绍了DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

点击蓝字 关注我们

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

用户案例 | T3 出行

业务挑战

作为一家车联网驱动的公司,T3出行汇聚了“人、车、路、云”各端的海量数据。为了承载如此多元化的数据以更好地释放数据价值,T3出行构建了以Apache Hudi为基础的企业级的数据湖,并在此之上搭建了BI分析,机器学习,数据质量,权限管理等一系列平台,为业务提供强有力的支撑。

同时,T3出行使用Apache DolphinScheduler作为全平台的任务调度载体,任务类型包含Spark、SQL、Shell、Python等,日均任务数量4w+。且随着内部平台越来越多,业务结构越来越复杂,也在倒逼内部对Apache DolphinScheduler适用性、可靠性及能效的不断提升,愿景是实现从数据接入到数据应用的一站式数据应用于交互。

01

解决方案

01

数据湖架构

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

来自Kafka的流式数据会对接Flink进行流式消费;随后Flink会以低延迟的形式将数据写入到Hudi数据湖中。Apache DolphinScheduler及其他组件以此为基础围“湖”而建,架构整体上保证了数据湖上低延迟的 Pipeline 高效调度与加工。

02

提高适用性

  • 依赖任务逻辑重构

对于非depend-all的依赖任务,以任务实例视图代替工作流实例视图作为依赖判定基准。如果因为一个没有包含目标依赖任务的工作流片段而导致依赖任务判定异常,这显然是不符合预期的。下图以恢复失败场景为例:

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

  • 跨Apache DolphinScheduler版本依赖

为了既可以使用高版本Apache DolphinScheduler的新特性,又不对线上低版本Apache DolphinScheduler做变更,同时保证Apache DolphinScheduler高低版本间互通、协同调度,实现了跨Apache DolphinScheduler版本依赖。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

  • ds-client

提供ds-client用于内部平台与DScheduler交互。多数情况下,业务倾向于通过消息触发的方式与调度进行交互,通过ds-client可以将Apache DolphinScheduler核心功能完全释放到平台侧,对于上层业务来说甚至不感知调度的存在。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

03

提高可靠性

  • 提高SPARK任务容错

  1. 异步获取application id,不再依赖解析任务日志,spark日志级别可设置为INFO以上

  2. 添加针对业务使用"spark.yarn.submit.waitCompletion=false"参数时的容错

  3. 添加针对rm主备倒换期间yarn任务的容错及校验

  • 精细化监控与告警

例如增加服务负载监控与告警;或自定义工作流定义未运行监控告警等。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

  • 黑名单与滚动升级

虽然可以依赖Apache DolphinScheduler master/worker容错来类似实现滚动升级,但任务容错的原理是kill&restart,低效且缺失容错监控手段。同时在日常运维时,也缺少对于故障节点的规避措施。对此,T3出行支持了master/worke黑名单管理,并基于此实现了滚动升级。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

04

提高能效

  • 资源中心缓存

对于引用了资源中心文件的任务,在每次执行时都要执行下载操作是冗余的。为此,T3出行实现了资源中心缓存,同一台worker节点上的同个资源中心文件,可以被所有任务反复引用,并保证本地缓存与资源中心文件的一致性。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

  • 数据源集成Kyuubi,为使用hive数据源的SQL任务提效 

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

02

用户收益

  1. 受益于Dolphin Scheduler的高扩展性和开放性,T3在性能、稳定性及易用性方面做了很多创新和优化,使得DS所在公司内所涵盖的业务越来越广,调度需求越来越多。

  2. 过程中真实地帮助业务部门以较低的门槛启动大数据相关需求,同时提升了数据开发部门的研发效率。

  3. 目前,T3出行内部聚焦在如何通过Apache DolphinScheduler实现大数据开发的CI\CD管理,这将使Apache DolphinScheduler一站式开发更加完善。

03

用户简介

T3出行是是由一汽、长安、东风三家央企联合阿里、腾讯、苏宁三家知名互联网公司共同成立的主打B2C的网约车平台,是国内首家基于车联网的出行平台。公司提供的服务包括出租车、专车、拼车、代驾、租车等多种出行方式。

T3出行的宗旨是为用户提供更加安全、便捷和舒适的出行体验,同时也为司机和车主提供更加优质的服务和收益。

参与贡献

随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

添加社区小助手微信(Leonard-ds) 

添加小助手微信时请说明想参与贡献。

来吧,开源社区非常期待您的参与。

< 🐬🐬 >

更多精彩推荐

☞PyDolphinScheduler 发布 4.0.3 版本,修复无法提交文件到资源中心的问题

☞优秀用户案例有奖征集 | 活动火热开启,快来投稿!

☞Apache DolphinScheduler 从 1.3.4 升级至3.1.2 过程中的问题记录及解决方案

☞Apache DolphinScheduler 3.1.5 发布,修复工作流实例甘特图查看异常等问题

☞去年办了这么多场Meetup都没有你,2023年赶紧安排起来!

☞为什么工作流中的数据质量要尽早验证,经常验证?

☞【每周 FAQ】第二期 | 回答你关于 Apache DolphinScheduler 的疑问

点击阅读原文,点亮Star支持我们哟DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验文章来源地址https://www.toymoban.com/news/detail-423235.html

到了这里,关于DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AllData一站式大数据平台【一】

    ​ 💥🔥 Hey there! I\\\'m AllDataDC. Developing BigData Platform Exploring new technologies Studying Computer Science Enthusiast in BigData and AI Full Stack developer and BigData developer Create a product that is useful to society [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RsXUstB2-1679966837577)(

    2024年02月02日
    浏览(130)
  • 实用便捷!一站式BI系统推荐

    在企业数字化转型过程中,BI系统可以建立业务、数据的双驱引擎,形成业务、数据的互补作用,通过建立数字化技术架构,明确企业的战略定位和业务目标,从而支撑实现这个目标。而一站式BI系统,则是指可以轻松从数据采集进行到数据可视化分析环节的BI系统。拥有一个

    2024年02月16日
    浏览(53)
  • 布谷鸟配音:一站式配音软件

    这是一款智能语音合成软件,可以快速将文字转换成语音,拥有多种真人模拟发音,可以选择不同男声、女声、童声,以及四川话、粤语等中文方言和外语配音,并且可对语速、语调、节奏、数字读法、多音字、背景音等进行全方位设置,可以自动合成语音,无需专人录制和

    2024年02月13日
    浏览(55)
  • AllData一站式大数据平台【二】

    AllData科学护城河:一种在数据驱动的科学和研究领域中, 保护和维护数据的竞争优势和独特性的解决方案。 AllData通过汇聚大数据与AI领域生态组件,提供自定义化数据中台。 包括大数据生态方案,人工智能生态方案, 大数据组件运维方案,大数据开发治理方案, 机器学习方案,大

    2024年02月02日
    浏览(61)
  • 【STL】 string类使用一站式攻略

    目录 一,STL 1. 简介 2. STL的版本 3. STL 六大组件   4.  学习STL, 三境界 5. 学会查看C++文档  二, string类 1. 相对于C语言,我们为什么还需要学习C++的string? 2. 头文件 3.  常见构造函数 4.  operator=    5.  operator[]    at函数 6. string容量方面 1. 关于  size 与 length  的选择 2. 关

    2024年02月09日
    浏览(57)
  • springboot minio 工具类,一站式解决

    注意 minio 新版本有9000和9090两个端口,web访问是9000,但走api上传和访问都是9090端口 引入pom controller

    2024年01月20日
    浏览(59)
  • k8s一站式使用笔记

            细节太多,建议零碎时间多遍看,k8s版本低于1.24,需要对接docker容器 2.1.关闭防火墙和selinux 2.2. 关闭swap分区 2.3.修改hosts文件 设置主机名(不设置也可以,但是要保证主机名不相同) 修改本地hosts文件 2.4.修改内核参数 2.5.安装docker 配置yum源(这里使用阿里云的源)

    2024年02月15日
    浏览(48)
  • Elasticsearch从结构到集群一站式学习

    elasticsearch结合kibana、Logstash、Beats,也就是elastic stack (ELK)。被广泛应用在日志数据分析、实时监控等领域。 什么是elasticsearch? 一个开源的分布式搜索引擎,可以用来实现搜索、日志统计、分析系统监控等功能 什么是elastic stack (ELK) ? 是以elasticsearch为核心的技术栈,包括beats、

    2023年04月11日
    浏览(49)
  • 一站式自动化测试平台-Autotestplat

    3.1 自动化平台开发方案 3.1.1 功能需求 3.1.3 开发时间计划 如果是刚入门、但有一点代码基础的测试人员,大概 3 个月能做出演示版(Demo)进行自动化测试,6 个月内胜任开展工作中项目的自动化测试。 如果是有自动化测试基础的测试人员,大概 1 个月能做出演示版(Demo)进行自动

    2024年02月13日
    浏览(52)
  • 提升技能,挑战自我——一站式在线题库小程序

    在这个信息爆炸的时代,我们总是在寻找一种方式,让自己在众多的知识海洋中快速提升技能,挑战自我。今天,我要向大家推荐一款全新的在线题库小程序 KD蝌蚪阿坤 ,它将帮助你实现这个目标。 KD蝌蚪阿坤 是一款全面的在线题库类应用,涵盖了 阿里云认证 、 华为云认

    2024年02月08日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包