数据治理|数据资产中心

这篇具有很好参考价值的文章主要介绍了数据治理|数据资产中心。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

01

前言

我们来聊聊数据治理最最核心的部分——数据资产治理,本文主要阐述数据资产治理的策略和工具建设思路。

02

基本概念

广义的数据资产涵盖一切非结构化、半结构化和结构化数据,狭义的数据资产主要包括业务侧的业务日志、流数据的topic、批数据的数据表、生产调度任务/作业,模型层的指标、维度和数据集,应用层的报表、API、应用/服务等,本文主要面向狭义的数据资产,其中又以大家接触最多的数据表、数据指标、报表为主。

03

问题分析

1)用户A是数据开发工程师,对数据表结构和内容较为熟悉,日常工作内容主要是数据采集、数仓建模(ETL)和运维问题排查,主要需求查询数据表上下游生产链路及生产调度作业的执行情况,同时也会随机探查数据字段、枚举值和定义函数等内容来辅助进行数据开发。

2)用户B是业务侧数据分析师,具备基本的数据挖掘分析能力,日常工作主要是面向业务一线产出数据分析报告、配置业务指标和报表,需要根据业务需求查询的数据存储在哪张数据表,以及知悉数据表内各字段的定义、枚举值等,从而确定是否满足查询需求。

3)用户C是数据管理人员,对数仓建模规范和数据口径定义比较熟悉,日常工作主要是规范数据开发流程、降低数据资源存储和开发成本,同时保障业务报表产出及时性和质量,希望资产中心能提供统一的口径维护、资产监控评测等能力。

04

治理目标

综上,数据资产中心的核心用户是各业务侧的数据分析师、产品经理、数据运营等用户,他们构成了数据资产中心的消费端,是数据资产得以流通并进而产生交换价值的关键,而资产中心供给端的用户群体主要是数据开发者和数据管理者。

因此,面向消费端,资产中心主要解决找人找数和有好数的痛点,核心治理目标为保障数据资产元信息的完整性、规范性和一致性,面向供给端,资产中心主要解决生产开发提效、资源成本管控的痛点,治理目标为降本增效。

05

行业调研

研究近年来主要数据论坛上各大厂数据资产中心的建设经验,特选取滴滴和腾讯作为调研目标,详情如下:

1. 滴滴数据梦工厂

1)场景分析:如图表2所示,滴滴主要数据资产分为人、路、车三类,主要呈现出数据量极大、结构化数据占比高、数据安全等级高等特点,主要需求为数据资产成本治理、数据安全治理和数据质量治理。

2)解决思路:

如图表3所示,滴滴内部将数据服务化、指标管理平台和资产管理平台统一为数据内容建设领域,定位为向上服务各类数据应用平台,向下对接数据开发平台的中间公共数据层,以数据内容为抓手,资产管理平台统一作为数据资产元信息采集和管理的工具,通过指标管理平台规范资产口径和质量,再通过数据服务化将数据资产服务到业务团队。

2. 腾讯游戏数据资产管理平台

1)场景分析:腾讯游戏旗下包含上百款各类端游、页游和手游,数据量极大,存在数据多样缺乏统一标准、口径定义不一致、链路质量不高无法快速定位问题、数据价值和成本难以评估等痛点。

2)解决思路:腾讯游戏对资产治理主要构建了两大体系,分别是数据资产的元数据管理体系和数据资产价值的评估体系,其中元数据管理体系涉及元数据应用、元数据管理、元数据存储和元数据采集等范畴,数据资产价值评估体系则主要从热度、广度和收益度三个视角进行评估

3. 调研总结

分析滴滴和腾讯的分享内容,发现两家头部公司对数据资产治理都有一个相同点,即将各类数据资产治理通过平台化的手段去落地实施,都关注到了资产的元数据规范性、安全性和成本,都提供了数据资产检索和血缘链路检索等服务。在侧重点上,滴滴的资产管理工具更加丰富和成熟,考虑到了数据生产者和管理者的痛点,而腾讯的亮点在于对数据资产价值评估体系的独特设计,以上经验均值得我们借鉴和学习。

06

产品架构

如图表14所示,数据资产中心一共分为三层,分别是服务层、管理层和采集层,其中服务层面向数据分析师、数据产品、业务运营等数据消费端用户,提供数据资产检索相关服务能力;管理层主要面向数据资产管理者,主要代表为各业务线产品/技术团队的数据产品经理、研发工程师和主要负责人,提供数据资产录入和维护能力,提供资产成本治理服务;采集层主要面向各数据来源方,包括但不限于埋点元信息采集、业务数据库元信息采集、报表/指标元信息采集、人员组织信息采集等等,同时,采集完的元信息,需要资产维护和管理者按照管理层提供的统一模型进行定义落库。

07

产品设计

1. 数据接入

产品定位:数据资产中心核心是各类数据资产元信息的中央数据库,各类数据资产的元信息采集主要分为上游业务系统自动采集和资产中心前端页面手工输入两部分,因此,数据接入模块承担了资产中心开源和标准定义的职能。

规范定义:数据资产中心需要采集hive、kafkatopic、clickhouse、druid、报表、指标、API等等结构各异的资产元信息,针对各类异构数据进行统一定义并整合分析绘制出数据地图是资产中心需要解决的主要问题,系统设计伊始便要考虑各类资产的复杂性和差异性以及未来的通用性,因此,如果不定义一套统一的元信息收录采集标准,则随着数据资产的收录一定会出现资源管控成本和元信息质量降低等问题。

2. 数据地图

资产检索:支持普通搜索、高级搜索,同时向用户推荐结构化整理的知识图谱

资产详情:资产详情页展示资产的基础信息、业务信息和技术信息,同时提供权限申请、资产收藏、血缘链路查询、快捷取数、SQL模板生成等能力

3. 资产维护

数据资产中心提供了管理者视角的资产录入和维护界面,支持以资产中心为统一维护平台进行资产维护,保障资产元信息的及时更新

4. 资产治理

质量分析:资产治理提供数据资产质量测评和分析报告,通过计算资产元信息完整度、规范性、重复性等来进行分析评估

治理榜单:分为个人榜和团队榜,综合计算所负责资产的质量(完整性、规范性、唯一性等)分、成本分(存储成本和增长趋势等)、评价分(用户评价、查询热度等)来进行排名,提供日排名、周排名和月排名,每个月重置一次数据。

5. 资产交接

资产中心提供一站式资产交接处置能力,减少因离职造成的资产无人维护和安全隐患

08

未来展望

通过以上内容介绍,目前国内作者能接触到的主流数据资产管理平台的主要功能就都基本介绍完毕了,展望未来,我认为,资产中心基于它数据内容采集和管理的特点,其实是可以深入到数据应用和服务领域,通过先进的搜索和AI算法,快速提供轻量化的数据可视化、数据分析和归因预测等服务,在满足业务找人找数的需求上,直接反馈数据结论,简化后续业务找到数据后再去分析数据的流程,提高数据分析效率。

参考国外已有产品,比如ThoughtSpot(一款基于搜索引擎的数据报表自动化生产的工具),以搜索为切入点,基于元数据之间的关联和构建,快速推荐和绘制可视化图表,提供轻量化配置能力,快速满足用户数据分析需求:

又比如Einstein Discovery,基于用户的数据自动关联,并从中对数据内容进行分析和解读,并将分析结果以自然语言的方式为用户提供解读报告,快速且轻量化地回答用户:“发生了什么?为什么会发生?即将发生什么?需要怎么做?”:文章来源地址https://www.toymoban.com/news/detail-481885.html

到了这里,关于数据治理|数据资产中心的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 什么是数据管理,数据治理,数据中心,数据中台,数据湖?

    大家好,我是独孤风,大数据流动的作者。 最近几个概念频繁出现在大家的视野内。 什么是数据管理,数据治理,数据中心,数据中台,数据湖? 他们之间又有怎么样的区别和联系呢? 这几个概念常常让人混淆,今天我们就来详细解析一下。 数据管理是指组织对其整个数

    2024年02月17日
    浏览(41)
  • 江铃晶马 X 袋鼠云:搭建企业级数据资产中心,推进打造“智数晶马”

    江铃集团晶马汽车有限公司(简称:晶马汽车)系江铃集团全资子公司,属集团六大整车企业之一。晶马汽车是以大、中、轻型客车(含新能源客车)、乘用车(不含轿车)、专用车等车型研发、生产、销售和服务为核心的整车企业,涉及客运、公交、旅游、通勤、旅居车、

    2024年02月04日
    浏览(46)
  • PtahDAO:全球首个DAO治理资产信托计划的金融平台

    金融科技是当今世界最具创新力和影响力的领域之一,区块链技术作为金融科技的核心驱动力,正在颠覆传统的金融模式,为全球用户提供更加普惠、便捷、安全的金融服务。在这个变革的浪潮中,PtahDAO(普塔道)作为全球首个DAO治理资产信托计划的金融平台,引起了业界的

    2024年02月14日
    浏览(33)
  • AI日报:戴尔首席执行官:我们可能在10年内需要100倍以上的数据中心

    戴尔创始人兼首席执行官迈克尔·戴尔表示,随着对人工智能服务需求的增加,数据中心的容量可能必须在10年内从目前的水平增加100倍。 戴尔在SXSW 2024的炉边谈话中表示:“肯定需要对数据中心容量进行大规模扩建。”。“这个国家和世界各地已经有很多项目来建设这种能

    2024年04月14日
    浏览(42)
  • 智能资产管理中的区块链应用:资产登记和管理的去中心化

    作者:禅与计算机程序设计艺术 随着互联网金融和大数据技术的快速发展,智能资产管理已经成为一个热门的话题。传统的资产管理主要依赖于传统的金融中介机构,这些机构存在一些无法解决的问题,例如信任问题、安全问题、效率问题等。而区块链技术的出现,为智能资

    2024年02月15日
    浏览(52)
  • AI 图像生成工具可以取代摄影师吗?让我们从原理开始聊聊

    AI 的风已经吹向了每一个人,在这篇文章中我们一起来聊一聊 AI 图像生成的原理以及未来。 作为一个非职业的摄影爱好者,我通常会在 Instagram 上面搜罗各种各样的优质图片并将其放进我的收藏夹。其中,有一位我关注了很久的德国摄影师,他的作品有很多值得我学习的地方

    2024年02月03日
    浏览(42)
  • Web3与社会契约:去中心化治理的新模式

    在数字化时代,技术不断为我们提供新的可能性,而Web3技术作为一种基于区块链的创新,正在引领着互联网的下一波变革。它不仅改变了我们的经济模式和商业逻辑,还对社会契约和权力结构提出了全新的挑战和思考。本文将深入探讨Web3的基本概念、与社会契约的关系,以

    2024年04月17日
    浏览(37)
  • Eureka注册中心:实现微服务架构下的服务发现与治理的艺术(一)

    本系列文章简介:         在本系列文章中,我们将深入探讨 Eureka 注册中心在微服务架构中的应用和实践。我们将介绍 Eureka的基本原理、关键特性以及配置和优化方法 。同时,我们还将分享如何通过 监控和日志分析 来保障Eureka注册中心的稳定运行。希望通过本文的阅

    2024年02月21日
    浏览(45)
  • 为什么我们需要去中心化存储?

    为什么我们需要去中心化存储? 我们的社会正处于前所未有的信息大爆炸时代,未来将是数据成为主要生产要素的数字时代,而 Web3 也不外乎于此,作为数据解决方案——去中心化存储,不仅是区块链技术的三大支柱(计算、存储、网络)之一,也是 Web3 领域最早出现也最受

    2024年02月02日
    浏览(84)
  • Web3.0介绍与产业赛道(去中心化,金融与数字资产,应用与存储,区块链技术)

    1、web3.0时代——区块链技术 Web3.0是什么 Web3.0是指下一代互联网技术,它将在现有的Web2.0技术基础上, 进一步深化人与人、人与物、物与物之间的连接和交互 ,实现更高效、更安全、更去中心化、更开放的互联网生态。 Web3.0是由区块链技术和去中心化应用(DApp)所驱动的,

    2024年02月03日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包