一站式数据可观测性平台 Datavines 正式开源啦

这篇具有很好参考价值的文章主要介绍了一站式数据可观测性平台 Datavines 正式开源啦。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Datavines是一站式开源数据可观测性平台,提供元数据管理、数据概览报告、数据质量管理,数据分布查询、数据趋势洞察等核心能力,致力于帮助用户全面地了解和掌管数据,让您做到心中有数,目前作为 Datavane 开源组织的重点推荐项目,正式开源,欢迎大家使用。

核心特性

数据目录

  • 定时获取数据源元数据,构造数据目录

  • 定时监听元数据变更情况

  • 支持元数据的标签管理

一站式数据可观测性平台 Datavines 正式开源啦,数据质量,数据可观测性,开源,数据库,java

数据质量监控

  • 内置 27 个数据质量检查规则,开箱即用

  • 支持 4 种数据质量检查规则类型

    • 单表单列检查类型

    • 单表自定义SQL检查类型

    • 跨表准确性检查类型

    • 两表值比对检查类型

  • 支持配置定时任务进行定时检查

  • 支持配置 SLA 用于检查结果告警

一站式数据可观测性平台 Datavines 正式开源啦,数据质量,数据可观测性,开源,数据库,java

数据概览

  • 支持定时执行数据探测,输出数据概览报告

  • 支持自动识别列的类型自动匹配合适的数据概况指标

  • 支持表行数趋势监控

  • 支持列的数据分布情况查看

一站式数据可观测性平台 Datavines 正式开源啦,数据质量,数据可观测性,开源,数据库,java

插件化设计

平台以插件化设计为核心,以下模块都支持用户自定义插件进行扩展

  • 数据源:已支持 MySQLImpalaStarocksDorisPrestoTrinoClickHousePostgreSQL
  • 检查规则:内置空值检查、非空检查、枚举检查等27个检查规则
  • 作业执行引擎:已支持SparkLocal两种执行引擎。Spark 引擎目前仅支持Spark2.4版本,Local 引擎则是基于JDBC开发的本地执行引擎,无需依赖其他执行引擎。
  • 告警通道:已支持邮件
  • 错误数据存储:已支持 MySQL本地文件(仅支持Local执行引擎)
  • 注册中心:已支持 MySQLPostgreSQLZooKeeper

多种运行模式

  • 提供Web页面配置检查作业、运行作业、查看作业执行日志、查看错误数据和检查结果

  • 支持在线生成作业运行脚本,通过 datavines-submit.sh 来提交作业,可与调度系统配合使用

一站式数据可观测性平台 Datavines 正式开源啦,数据质量,数据可观测性,开源,数据库,java

容易部署&高可用

  • 平台依赖少,容易部署

  • 最小仅依赖 MySQL 既可启动项目,完成数据质量作业的检查

  • 支持水平扩容,自动容错

  • 无中心化设计Server 节点支持水平扩展提高性能

  • 作业自动容错,保证作业不丢失和不重复执行

项目架构

一站式数据可观测性平台 Datavines 正式开源啦,数据质量,数据可观测性,开源,数据库,java

CatalogManager

CatalogManager 是负责管理元数据的组件,主要负责元数据的存储、查询以及元数据获取任务的调度和容错处理等。

DataQualityCenter

DataQualityCenter 是负责数据质量管理的组件,主要负责数据质量规则的管理、数据质量作业的调度、执行和自动容错处理等。

快速上手

数据概览

进行数据概览只需下面3步:

  • 创建数据源(或者选择创建好的数据源)
  • 点击相应的表
  • 点击右上角 运行概览 并选择想要探查的列

Datavines数据概览演示

数据质量检查

进行数据质量检查只需下面4步:

  • 点击想要进行检查的列,点击 添加作业
  • 选择 检查规则 并填入参数
  • 选择 检查公式 ,比如 实际值/期望值 x100% ,填入比较符和阈值
  • 点击保存并运行即可

Datavines数据质量检查演示

加入我们

Datavines 的目标是成为更好的数据可观测性领域的开源项目,为更多的用户去解决元数据管理和数据质量管理中遇到的问题。在此我们真诚欢迎更多的贡献者参与到社区建设中来,和我们一起成长,携手共建更好的社区。

  • 项目地址: https://github.com/datavane/datavines
  • 问题和建议: https://github.com/datavane/datavines/issues
  • 贡献代码: https://github.com/datavane/datavines/pulls

关于Datavane

Datavane 是一个专注于大数据领域的开源组织(社区),由一群大数据领域优秀的开源项目作者共同创建,旨在帮助开源项目作者更好的建设项目、为大众提供高质量的开源软件,宗旨是:只为做一个好软件。目前已经聚集了一批优质的开源项目,涉及到数据集成、大数据组件管理、数据质量等。

Datavane 社区中,所有的项目都是开源开放的,代码质量和架构设计优质的潜力项目。社区保持开放中立、协作创造、坚持精品,鼓励所有的开发者、用户和贡献者积极参与我们的社区、共同合作,创新创造,建设一个更加强大的开源社区。

官 网: http://www.datavane.org/
Github : https://github.com/datavane文章来源地址https://www.toymoban.com/news/detail-569813.html

到了这里,关于一站式数据可观测性平台 Datavines 正式开源啦的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 一站式元数据治理平台——Datahub入门宝典

    随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为新一代的元数据管理平台,Datahub在近一年的时间里发展迅猛,大有取代老牌元数据管理工具Atlas之势。国内Datahub的资料非常少,大部分公司想使用Datahub作为自己的元数据管理平台,但可参

    2024年02月11日
    浏览(54)
  • 金融监管平台系统-一站式监管服务体系、强大数据监管模型

    一、金融监管平台系统简介 金融监管平台是为协助金融办加强日常监管效率,解决监管存在的问题,帮助金融办进一步加强对小额贷款公司的日常监管,及时掌握涉及小额贷款公司的业务监管信息,有效防范金融风险而设计的一套系统。监管平台的建立除了为金融办等主管部

    2024年02月09日
    浏览(51)
  • datahub元数据管理平台从安装到使用一站式指南(未完)

    目录 一 datahub安装 1.1 datahub在线安装 1.1.1 docker在线安装 1.1.2 python在线安装 1.1.3 datahub在线安装并启动 1.2 datahub离线安装 1.2.1 docker离线安装 1.2.2 python离线安装 1.2.3 datahub离线安装并启动 1.3 本地环境替换datahub docker 1.3 安装过程中可能遇到的问题 1.3.1 python3安装后导致yum不能正常

    2024年02月06日
    浏览(62)
  • 奥威BI-金蝶云星空SaaS版一站式平台:对接数据、做分析

    金蝶云星空和BI大数据分析平台都在企业数字化转型中扮演了重要的角色,为企业提供了全面的数字化解决方案和数据分析功能,两者强强联合不仅能提高部署效率,更能增强数据分析、数据可视化效果,帮助企业更好地适应市场变化和用户需求,提高企业的竞争力和效率。

    2024年02月16日
    浏览(35)
  • OpenAI宣布安卓版ChatGPT正式上线;一站式 LLM底层技术原理入门指南

    🦉 AI新闻 🚀 OpenAI宣布安卓版ChatGPT正式上线 摘要 :OpenAI今日宣布,安卓版ChatGPT已正式上线,目前美国、印度、孟加拉国和巴西四国的安卓用户已可在谷歌Play商店下载,并计划在下周拓展到更多地区。ChatGPT是一款聊天机器人应用,用户可向其询问问题的答案、指导或建议等

    2024年02月15日
    浏览(40)
  • 移远云服务QuecCloud正式发布,一站式为全球客户提供创新有效的解决方案

    4 月12日,在“万 物智联 · 共数未来”移远通信物联网生态大会上,移远通信宣布正式推出其物联网云服务——QuecCloud。 QuecCloud 具备智能硬件开发、物联网开放平台、行业解决方案三大能力,可为开发者和企业用户提供从硬件接入到软件应用的全流程解决方案,助力行业客

    2023年04月15日
    浏览(32)
  • 日均调度 10W+ 任务实例,DolphinScheduler 在蔚来汽车一站式数据治理开发平台的应用改造

    大家好我是张金明,在蔚来汽车担任大数据平台研发工程师。这次和大家分享的是 Apache DolphinScheduler 在蔚来汽车一站式数据治理开发平台的应用和改造,接下来我将从背景、应用现状和技术改造三个方面去分享一下。 在蔚来汽车构建一个统一的数据中台之前,我们面临这样

    2024年02月11日
    浏览(60)
  • 一站式自动化测试平台-Autotestplat

    3.1 自动化平台开发方案 3.1.1 功能需求 3.1.3 开发时间计划 如果是刚入门、但有一点代码基础的测试人员,大概 3 个月能做出演示版(Demo)进行自动化测试,6 个月内胜任开展工作中项目的自动化测试。 如果是有自动化测试基础的测试人员,大概 1 个月能做出演示版(Demo)进行自动

    2024年02月13日
    浏览(43)
  • 一站式低代码开发平台iVX初探

           在数字化时代的浪潮中,低代码已经逐渐成为一种趋势和潮流。作为国内首个图形化通用无代码编程平台,iVX提供了一款强大、高效、易学的零代码开发语言和全生命周期一站式云原生应用开发工具,无疑为低代码界带来了一场革命。        低代码(Low-Code)是一种

    2024年02月10日
    浏览(53)
  • 一站式敏捷研发协同平台,敏捷研发解决方案

     Leangoo领歌是一款 永久免费的专业的敏捷开发管理工具 ,提供端到端敏捷研发管理解决方案,涵盖敏捷需求管理、任务协同、进展跟踪、统计度量等。 Leangoo领歌上手快、实施成本低,可帮助企业快速落地敏捷,提质增效、缩短周期、加速创新。 Leangoo领歌区别于传统项目管

    2024年01月24日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包