数据仓库与数据建模理论

这篇具有很好参考价值的文章主要介绍了数据仓库与数据建模理论。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数据仓库的特性:
面向主题 按主题分类
集成 将分散在各个数据库的数据集中到一起
稳定 非实时,一般只做查询
变化 记录历史,反映最近一段时间的变化

数仓分层的意义之一是1.问题定位简化,每层只处理一个简单的问题;

2.中间结果数据,增加复用,减少冗余

3.真实数据与统计数据的解耦

范式建模可以降低数据一致性维护的难度
第一范式:原子性

第二范式:不能有部分函数依赖(部分依赖于主键

第三范式:不能有传递函数依赖

事实表主要有两类字段:一类是事实度量,一类是纬度外键

范式建模的基础上进行一定的冗余,也就是星型模型,雪花模型就是在星型的基础上对维表进行范式,但也不可能变成完全的范式(完全的范式就是关系模型)文章来源地址https://www.toymoban.com/news/detail-421180.html

到了这里,关于数据仓库与数据建模理论的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据仓库基本理论Ⅰ

    数据仓库是一个面向主题的,集成性的,非易失性的,时变性的数据集合,用于管理决策。 数据仓库解决的问题: 为业务部门提供准确清晰的报表 为管理人员提供更强的分析能力 为数据挖掘和知识发现奠定基础 面向主题 数据仓库内的数据是 针对特定的业务主题 。数据仓

    2024年02月22日
    浏览(27)
  • 数据仓库设计理论

    1.1、数据仓库介绍 数据仓库是一个用于集成、存储和分析大量结构化和非结构化数据的中心化数据存储系统。它旨在支持企业的决策制定和业务分析活动。 1.2、基本特征 主题导向:数据仓库围绕特定的主题或业务领域进行建模和组织,例如销售、客户、供应链等。这种主题

    2024年02月16日
    浏览(24)
  • 1.数据仓库基本理论

    概念 : 数据仓库是一个用于存储、分析、报告的数据系统 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策 特点 : 数据仓库本身并不“生产”任何数据,其数据来源与不同外部系统 同时数据仓库自身不需要“消费”任何数据,其结果开放给各个

    2024年02月11日
    浏览(24)
  • 企业级数据仓库-理论知识

    大数据中间件 Hive:将SQL转化成分布式Map/Reduce进行运算,也支持转换成Spark,需要单独安装Hive集群才能访问Spark,支持60%的SQL,延迟比较大。 SparkSQL:属于Spark生态圈,Hive on Sqark。 HBase: NoSQL,高并发读,适合表结构频繁变动。 Impala: MPP架构的数据查询引擎,低层兼容Hive、Spark SQL,

    2024年02月07日
    浏览(32)
  • 数据仓库DW-理论知识储备

    数据仓库具备 采集数据、存储数据、分析和计算 的功能,最后得出一些有用的数据,一些目标数据来使用。 采集来自不同源的数据,然后对这些数据进行分析和计算得出一些有用的指标,提供数据决策支持。 数据的来源有:系统的业务数据、用户的行为数据、爬虫数据等。

    2024年02月07日
    浏览(25)
  • 数据仓库—大数据建模

    大数据建模是一个关键的环节,它直接影响到数据仓库的设计和运行效果。下面将详细介绍一下大数据建模的一般步骤和关键概念。 建模步骤 需求分析 :首先要对业务需求进行深入分析,了解业务的核心目标和数据分析的重点。只有明确了需求,才能有针对性地进行建模。

    2024年04月16日
    浏览(18)
  • 数仓建模—数据仓库初识

    数据仓库之父Bill Inmon在1991年出版的\\\"Building the Data Warehouse\\\"一书中所提出的定义被广泛接受 数据仓库(Data Warehouse)是一个 面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making

    2024年04月22日
    浏览(18)
  • 离线数仓(五)【数据仓库建模】

            今天开始正式数据仓库的内容了, 前面我们把生产数据 , 数据上传到 HDFS , Kafka 的通道都已经搭建完毕了, 数据也就正式进入数据仓库了, 解下来的数仓建模是重中之重 , 是将来吃饭的家伙 ! 以及 Hive SQL 必须熟练到像喝水一样 !         数据仓库 (dataware,简称 DW) 是

    2024年03月26日
    浏览(45)
  • 数学建模与数据分析 || 3. 面向数据的特征提取方法: 探索性数据分析

    一般情况下, 原始数据(又称粗数据, 存在缺失、异常、无关特征多等特点)是无法直接应用于模型进行数据分析的, 因为模型强烈依赖于相关性. 这种数据需要进行 特征提取 ,将数据的列进行修正, 生成具有相关性的列. 特征提取的方法有两种, 一种是 面向数据的探索性数据分析

    2024年02月06日
    浏览(33)
  • 某银行数据仓库建模流程和规范

    数据建模总体过程 协同总体过程 源系统名 UDSF源系统编号 UDSF源系统简名 核心系统 01 CEN 信贷系统 02 LNA 国际结算业务系统 03 INT 中间业务系统 04 NIN 卡前置系统 05 CRD 农贷 06 LNB 微贷 07 LNC 小额前置系统 08 STR 财务系统 09 FIN 网银系统 10 IBK 某银行UDSF系统在数据库中分为5个层次

    2024年02月06日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包