聊聊数据域和主题域的区别

这篇具有很好参考价值的文章主要介绍了聊聊数据域和主题域的区别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

大家好,我是大D。

这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念——数据域、主题域。有的公司对二者的界限并不明显,都统一称为数据域或者主题域;也有的公司两者是区分开使用的,那么数据域和主题域有什么区别呢,根据自身工作经验,聊下自己的见解。

数据域

数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。它是以业务系统的角度,对业务过程进行归纳,抽象出来的数据域。

业务过程可以概括为一个个不可拆分的行为事件,比如在电商业务中店铺商品浏览、网页区块点击、加购物车、下单、订单支付、确认收货等行为事件都属于业务过程,然后对这些业务过程产生的数据进行抽象提炼,可简单理解为对这些数据分类到不同的数据域中,要求所划分的数据域既能够涵盖当前所有的业务需求,又能将一个新业务无影响地被包含进来,或者扩展出一个新的数据域。

在电商业务中,对业务系统输出的数据进行数据域划分,可以有商品域、日志域、交易域、用户域、服务域等。

商品域:商品库存、上架、下架等;

日志域:店铺商品的浏览、点击等;

交易域:加购、下单、支付、确认收货、退款等;

用户域:注册、登录、信息修改等;

服务域:申诉、投诉、纠纷、评价等。

主题域

对于数据仓库的定义是这样的,它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。

可以把数据仓库类比为图书馆,集合中的数据就是书架上摆放的书籍。一个好的数据仓库,在其中取数就应该如同在图书馆中查找书籍一样准确快速,这就要求数仓有一个良好、规范的组织结构,能够对集合中的数据进行有序、有结构地分类组织和存储。如若不然,数仓就会沦为数据沼泽,使用和维护的成本都将会很高。

而主题题域在数仓建设中则是按照数据分析应用的角度进行划分的,通常是联系较为紧密的数据主题的集合。可以根据业务的需求特点,将从业务系统划分的数据域重新划分至不同的主题域。如同图书馆面向社会不同群体的需求,对图书划分为经济类、医学类、哲学类、管理类等多个主题。

数据域与主题域区别

数据域是自下而上,以业务数据视角来划分数据,一般进行完业务系统数据调研之后就可以进行数据域的划分。

主题域则自上而下,以业务分析视角来划分数据,一般进行完业务需求调研之后才可以进行主题域的划分。

例如,商品数据域是面向数据的,对数据的分类,数据驱动业务,更好地赋能业务;商品主题域是面向主题的,根据业务需求分析,从业务驱动进行分析场景的建设。
聊聊数据域和主题域的区别
举个更形象点的例子,建设数仓就像饭店做菜一样,数仓在面向业务系统数据根据其特点划分出数据域,如同厨房根据采购的食材特点将它们摆放在不同货架区,如肉禽区、果蔬区、调味区等。而数仓在面向业务分析根据其需求划分出主题域,如同饭店根据不同食客群体的口味需求将食材做成了不同菜系,如江浙菜、鲁菜、川菜等。

大家还有什么问题可以在下方留言,或者加入交流群一起探讨。

本文由mdnice多平台发布文章来源地址https://www.toymoban.com/news/detail-440863.html

到了这里,关于聊聊数据域和主题域的区别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 程序员行业还是高薪职业吗?我来和大家聊聊C++程序员该如何学习

    此外,程序员的劳动大多是脑力活动,不需要东奔西跑。这也就意味着,程序员的工作不会对身体健康造成太大的影响。 我们都知道,我们现在的生活水平越来越高科技,越来越先进。在这样的发展速度下,程序员怎么可能被淘汰呢?所以,别听网上的瞎说,什么互联网红利

    2024年02月05日
    浏览(52)
  • @Autowired和@Resource注解之间的关系区别,Bean的作用域和生命周期,Spring的执行流程

    目录 一. @Autowired 和 @Resource 注解 二. Bean的作用域  1. singleton(单例模式) 2. prototype(原型模式)(多例模式) 3. 请求作用域:request 4. 会话作用域:session 三. Spring 的执行流程 四. Bean 的生命周期   1. 实例化  2. 设置属性  3. Bean 初始化      3.1 执行各种各种 Aware 通知;     

    2024年02月04日
    浏览(61)
  • 今天给大家介绍一下华为智选手机与华为手机的区别

    华为智选手机是由华为品牌方与其他公司合作推出的手机产品,虽然其机身上没有“华为”标识,但是其品质和技术水平都是由华为来保证的。这些手机在制造、设计和使用方面都采用了华为的相关技术和标准,因此可以享受到和华为旗舰手机相同的优质使用体验。    目前

    2024年02月09日
    浏览(48)
  • 聊聊看React和Vue的区别

    Vue 更适合小项目,React 更适合大公司大项目; Vue 的学习成本较低,很容易上手,但项目质量不能保证...... 真的是这样吗?借助本篇文章,我们来从一些方面的比较来客观的去看这个问题。 从两个方面来看这个问题:社区的支持力度及文档的完善性 对于任何编程语言或框架

    2024年02月13日
    浏览(27)
  • 聊聊传统监控与云原生监控的区别

    传统监控的本质就是收集、分析和使用信息来观察一段时间内监控对象的运行进度,并且进行相应的决策管理的过程,监控侧重于观察 特定 指标。 但是随着云原生时代的到来,我们对监控提出了更多的要求: 通过监控了解数据趋势,知道系统在未来的某个时刻可能出问题,

    2024年02月16日
    浏览(44)
  • 聊聊Spring Boot几个版本的区别

    本文主要研究一下Spring Boot 2.7, 3.x这几个版本的区别 Spring Boot 2.0在2018年2月28日发布,Spring Boot 2.7是2.x的最后一个发布版本,该版本的开源将于2023年11月停止支持,商业支持可延长到2025年2月 flyway从8.0更新到了8.5 H2更新到了2.1.120 MSSQL driver从v9更新到了v10 OkHttp3将不再支持,改为

    2024年02月13日
    浏览(35)
  • 聊聊Linq中.AsEnumerable(), AsQueryable() ,.ToList(),的区别和用法

    当使用LINQ查询数据时,我们常常会面临选择使用 .AsEnumerable() , .AsQueryable() , 和 .ToList() 方法的情况。这些方法在使用时有不同的效果和影响,需要根据具体场景来选择合适的方法。 .AsEnumerable() 方法: 使用 .AsEnumerable() 方法可以将查询结果从数据库转换为 IEnumerableT 类型,从而

    2024年02月15日
    浏览(34)
  • 大数据趣味学习探讨(二):我是怎么坚持学习的

    CSDN话题挑战赛第2期 参赛话题:大数据趣味学习探讨 文章目录 要不要学,为什么要学大数据,最好的机会没有之一 一、根本性的问题 1、打仗最重要的是什么? 2、为什么总是知行不一 二、大数据到底好在哪 1、结论 2、大数据为什么是金矿 三、体系的学习方式 1、打仗最重

    2024年01月16日
    浏览(36)
  • 聊聊Spring Boot配置文件:优先级顺序、加载顺序、bootstrap.yml与application.yml区别详解

    在 Spring Boot 中,配置文件的优先级顺序是: application-{profile}.yml ( application-{profile}.properties ) application.yml ( application.properties ) bootstrap.yml ( bootstrap.properties )。其中, {profile} 表示不同的环境配置,如 dev 、 test 、 prod 等。 优先级从高到低,高优先级的配置覆盖低优先级

    2024年01月25日
    浏览(59)
  • 重启电脑数据丢失怎么恢复?这篇指南很受用!

    案例分享:“你好,我重新启动了我的win10电脑,电脑为什么再次开机后,下载的软件就不见了?不仅如此,我的文档也消失不见了,这令我很困惑。请问重启电脑数据丢失怎么恢复?请大家帮帮我!” 最近就有用户给小编反馈,自己在重启电脑的时候,发现桌面文件消失了

    2024年02月10日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包