数据集市与数据仓库的区别

这篇具有很好参考价值的文章主要介绍了数据集市与数据仓库的区别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数据仓库是企业级的,能为整个企业各个部门的运作提供决策支持;而数据集市则是部门级的,一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库。

1、两种数据集市结构

数据集市按数据的来源分为以下两种

(1)从属数据集市
数据集市与数据仓库的区别

所谓从属,是指其数据直接来自于中央数据仓库。该结构能保持数据的一致性。

一般为那些访问数据仓库十分频繁的关键业务部门建立从属的数据集市,能提高查询反应速度。

(2)独立数据集市
数据集市与数据仓库的区别
独立数据集市的数据子集来源于各生产系统,许多企业在计划实施数据仓库时,往往处于投资方面的考虑,首先建成独立数据集市,用来解决个别部门较迫切的决策问题。

2、数据仓库与数据集市的区别

(1)数据仓库:基于整个企业的数据模型建立,面向企业范围内的主题;

数据集市:按照某一特定部门的数据模型建立的,由于每个部门有自己特定的需求,因此,他们对数据集市的期望也不同。 部门主题与企业主题之间可能存在关联,也可能不存在。

(2)数仓存储整个企业内非常详细的数据;数据集市数据详细程度低一些,包含概要和综合数据多一些。

(3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。

(4)数据集市较少保留历史数据。

@二东东
RE: (3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。

在云上数据仓库时代(Redshift, BigQuery, Snowflake 出现的2016年之后)数据集市的数据组织一般采用宽表Wide Table就好了 因为:
宽表可以直接用于BI或者分析师进行分析 (他们习惯于直接分析一个二维表格,而不是拿星形模型再去join)星形模型的cost优势不存在了 因为在云上数据仓库时代 贵的是人工而不是数据存储 所以最省时省力可直接分析的的宽表 在成本上才有优势至于星型模型的另外两个优势performance and understandability 也是不如宽表的
综上 在这个时代 数据集市的数据组织应该是宽表文章来源地址https://www.toymoban.com/news/detail-427158.html

到了这里,关于数据集市与数据仓库的区别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ChatGPT token访问和API访问的区别,哪个更适合企业级应用?

    ChatGPT是基于OpenAI的GPT-4模型开发的一款聊天式人工智能,它可以理解和生成自然语言,与用户进行多轮对话。ChatGPT旨在为用户提供智能、有趣的对话体验,可用于回答问题、进行讨论等。ChatGPT Plus是针对ChatGPT的一项增值服务,通过订阅此服务,用户可以获得更多功能和优先

    2024年02月06日
    浏览(33)
  • 数据集市与数据仓库的区别

    数据仓库是企业级的,能为整个企业各个部门的运作提供决策支持;而数据集市则是部门级的,一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库。 1、两种数据集市结构 数据集市按数据的来源分为以下两种 (1)从属数据集市 所谓从属,是指其数据

    2024年02月01日
    浏览(32)
  • 企业级大数据体系结构

    作者:禅与计算机程序设计艺术 企业级大数据是指超大规模数据的集合,是管理者、分析师、决策者所需要分析和处理的一种信息资源。基于海量数据的复杂性及其多样性,实现数据可视化、数据挖掘、机器学习等数据处理功能的大数据平台也逐渐成为行业关注热点。因此,

    2024年02月06日
    浏览(37)
  • 阿里云大数据——搭建企业级数据分析平台

    目录 1、数据分析介绍 1.1数据分析基本介绍 1.2数据分析目的 1.3数据分析平台组成部分 1.4数据分析平台对应的场景 2、阿里云数加介绍 2.1数加是什么? 2.2“数加”是阿里云大数据的核心能力 2.3数加平台发展历程 3、常用的数加产品 3.1数加产品框架图 3.2数据分析平台常用的数

    2023年04月11日
    浏览(81)
  • 数据仓库、数据集市、数据湖,你的企业更适合哪种数据管理架构?

    建设企业级数据平台,首先需要了解企业数据,确认管理需求,并选择一个数据管理架构。那么面对纷繁复杂的数据来源,多元化的数据结构,以及他们的管理使用需求,企业数据平台建设该从何处入手呢?哪个数据管理架构适合自己的企业呢?本篇将介绍数据仓库、数据集

    2023年04月09日
    浏览(27)
  • 企业级大数据安全架构(四)Ranger安装

    作者:楼高 Ranger是支持审计功能的,安装时可以选择审计数据保存的位置,默认支持Solr和HDFS。HDFS的配置比较简单,这里就不赘述了,我们这里使用Ambari默认自带的Solr保存审计日志,下面部署Solr: 选择Infra Solr add service 在ambari中solr是Infra Solr 可以导出配置信息 更多技术信息

    2024年01月20日
    浏览(30)
  • Mysql 数据库开发及企业级应用

    1.1、为什么要使用数据库 ​ 程序员 Jack 还是在在校学习期间, 就听高年级的大哥忠告, “ 小伙子, 搞编程, 想要成为最牛逼的程序员, 一定要学好 C/C++语言和数据结构及算法” , Jack 谨记了这句忠告, 因为这位高年级的哥们还没毕业就已经被 BAT 公司预定, 在学校那是

    2024年02月16日
    浏览(40)
  • 大数据开发之Hive(企业级调优)

    创建测试用例 1、建大表、小表和JOIN后表的语句 2、分别向大表和小表中导入数据 1、基本语法 2、实例操作 1)查看下面这条语句的执行计划 (1)没有生成MR任务的 (2)有生成MR任务的 2)查看详细执行计划 10.2.1 列裁剪和分区裁剪 在生产环境中,会面临列很多或者数据量很

    2024年01月18日
    浏览(30)
  • 开源数据平台构建:从0到1搭建企业级数据平台系统

    作者:禅与计算机程序设计艺术 数据平台作为业务数据的重要基础设施,其提供的数据服务和分析能力已成为公司各部门协同工作、高效沟通、提升工作效率的关键。然而,由于不同行业领域需求的差异性、不同数据规模和复杂度等多种因素的影响,制造出具有高质量、低延

    2024年02月09日
    浏览(37)
  • 企业级大数据安全架构(三)修改集群节点hostname

    作者:楼高 在后续安装FreeIPA的过程中,要求机器名必须包含完整的域名信息。如果之前在Ambari集群节点上的机器名不符合这个要求,可以按照以下步骤在Ambari上修改所有节点的机器名: 1.部署节点说明 本次测试是三台 ambari 节点,主机名分别是 jz001,jz002,jz003 。 其中 amb

    2024年01月23日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包