数据仓库实验一:数据仓库建立实验

这篇具有很好参考价值的文章主要介绍了数据仓库实验一:数据仓库建立实验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


一、实验目的

  通过本实验,掌握在Sql Server(2012 或 2008 R2以上版本)中通过 Analysis Services 建立数据仓库的方法。包括如何在 BI Development Studio 的 Analysis Services 项目中定义数据源、数据源视图、维度、属性、层次结构和多维数据集,如何查看多维数据集的维度,理解并掌握 OLAP 分析的基本过程和方法。

二、实验要求

  能够针对某个领域的分析主题,建立事实表与维度表,设计星型模型或雪花模型。查看、编辑数据仓库的基本模型(即事实表与维度表之间的关系)。针对某一系统需求,从无到有设计一 个数据仓库基本架构,要求能够按不同维度进行多维数据查询分析。

三、实验内容

  某电商的业务销售涵盖全国范围,销售商品有家用电器和通信设备等。已建有网上销售业务管理系统,可以获取每日销售信息和顾客的基本信息等。要求为该电商建立一个能够提高市场竞争能力的数据仓库 SDWS,其主题是电商销售情况分析,包括以下分析功能。
(1)分析全国各地区每年、每季度的销售金额;
(2)分析各类商品在每年、每月的销售量。
(3)分析各年龄层次的顾客购买商品的次数。
(4)分析某年某季度各地区、各类商品的销售量。
(5)分析每年各省份、各年龄层次的商品购买金额。
(6)分析各产品子类、各地区、各年龄层次的销售量。
(7)其他销售情况分析等。

四、实验步骤

  为了简化起见,数据仓库采用星型模型。

1、维表设计

  在 SSMS 中,设计如下 4 个维度表。

(1)日期维度表Dates

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
手工录入适量数据:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(2)顾客维度表Customers

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
手工录入适量数据:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(3)地点维度表Locates

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
手工录入适量数据:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(4)商品维度表Products

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
手工录入适量数据:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集

2、事实表设计

  设计一个销售事实表 Sales,对应的表结构如下:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
假设该事实表中目前的数据如下所示:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
请注意:
(1)以上的 4 个维度表和1个事实表,都设置了主键(这是必须的)。
(2)为 Sales 事实表设置外键约束,使 Date_key,Cust_key,Locate_key,Prod_key 分别参照另外的 4 个维度表中的主键。

可以新建一个查询,为 Sales 表增加 4 个外键约束,如下:

alter table Sales add constraint fk_1 foreign key(Date_key) references Dates(Date_key)
alter table Sales add constraint fk_2 foreign key(Cust_key) references Customers(Cust_key)
alter table Sales add constraint fk_3 foreign key(Locate_key) references Locates(Locate_key)
alter table Sales add constraint fk_4 foreign key(Prod_key) references Products(Prod_key)

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
  在 SSMS 中建好的数据库以及其中的数据表的情况如下所示:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集

3、新建多维分析和挖掘项目

  在 Sql Server 2012 的 Data Tools 下(Sql Server 2008 R2 的 BI…),新建 Analysis Services 多维分析和挖掘项目,项目名称自拟。然后分别定义数据源、数据源视图、定义维表、定义多维数据集、部署项目、浏览已部署的多维数据集。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(1)定义数据源

打开 SSDT,创建 SSAS 项目,连接数据源。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
右键 “数据源” 点击 “新建数据源”。服务器名填入 LocalHost,再选择数据库。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
选择刚创建的数据连接 “LocalHost.SDWS”。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
下一步,选择 “使用服务账户”。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
最后,完成数据源定义。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(2)定义数据源视图

右键 “数据源视图”,点击 “新建数据源视图”,选择数据源 SDWS。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
点击左右箭头即可选中对应表格,右边为选择表格,全部选中即可。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
数据源视图就创建好了。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
(3)定义维表

右键维度,新建维表。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
“可用属性” 要全部勾选。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
单机 “完成”,保存维度。
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
Dates、Locates、Products维表的创建方法一样。

(4)定义多维数据集

右键 “多维数据集”,新建多维数据集。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
选择度量表(事实表)为 Sales,选择度量值。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
维度表要全选。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
单机 “完成”,保存多维数据集。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
设置完后右击项目名称点击 “部署”,即可部署成功。最后就出现了星型模型。

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
  关于维度的层次结构的定义、维度的处理,以及多维数据集的部署。最终完成后的界面参照如下:(基于SQLServer2012版本)

数据集部署成功后:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
Customers维度配置:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
Dates维度配置:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
Locates维度配置:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
Products维度配置:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
多维数据集浏览时,以下是参照界面:

2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集
2012通过analysis services 建立数据仓库,数据仓库与数据挖掘,数据仓库,大数据,数据挖掘,多维数据集

五、实验结果分析

(1)数据源定义:通过定义数据源,实现了与实际数据源的连接,确保了数据仓库能够获取到所需的源数据进行分析处理。
(2)数据源视图定义:通过定义数据源视图,实现了对数据源的抽象和简化,使得在多维分析项目中能够更方便地使用数据。
(3)维表定义:日期、顾客、地点和商品等维度表的创建和定义,为多维分析提供了关键维度信息,使得可以按照不同维度进行数据查询和分析。
(4)多维数据集定义:通过定义多维数据集,建立了事实表与维度表之间的关联,实现了多维数据的存储和分析,满足了电商销售情况分析的各项需求。
(5)数据集部署成功:成功部署了多维数据集项目,确保了数据仓库的数据可用性和准确性,使得可以进行后续的多维分析操作。
(6)维度配置和多维数据集浏览:通过对不同维度的配置和多维数据集的浏览,可以实现对电商销售情况的全面分析,包括地区销售金额、商品销售量、顾客购买行为等多方面的详细分析。

  总的来说,实验结果表明成功建立了针对电商销售情况分析的数据仓库 SDWS,并实现了多维分析的基本功能。通过对数据进行多维分析,可以深入挖掘数据背后的规律和趋势,为电商企业提供决策支持和市场竞争优势。

六、实验总结体会

  数据仓库的设计过程需要充分理解业务需求和数据特点,结合具体业务场景进行建模。在本实验中,针对电商销售情况分析的需求,采用了星型模型来设计数据仓库的维度表和事实表,这样的设计能够简洁清晰地反映业务事件的关联关系。
  在数据仓库的设计中,维度表的设计尤为重要。日期、顾客、地点和商品等维度在电商销售分析中扮演着关键的角色,通过手工录入适量数据并设置主键,为多维分析提供了基础数据支持。事实表的设计需要与维度表进行关联,并且需要考虑外键约束的设置,以保证数据的完整性和准确性。在本实验中,销售事实表Sales与日期、顾客、地点和商品等维度表建立了外键约束,确保了数据的关联性。
  在实际操作中,使用 SQL Server 提供的工具(如 SSMS 和 Data Tools)进行数据仓库的建模和多维分析项目的开发,能够有效提高效率并简化操作流程。通过定义数据源、数据源视图、维表、多维数据集等,完成了数据仓库的搭建和多维分析项目的部署。
  最终,通过多维数据集的浏览和配置,可以对电商销售情况进行多维分析,满足了实验中提出的各项分析需求,包括地区销售金额分析、商品销售量分析、顾客购买行为分析等多个方面的需求。
  总的来说,本次实验使我深入了解了数据仓库的建立方法和多维分析的基本过程,对于应用 SQL Server 进行数据仓库建模和多维分析项目开发有了更深入的理解和实践经验。这对我今后在类似领域的工作和研究中将会起到积极的指导和帮助作用。文章来源地址https://www.toymoban.com/news/detail-851391.html

到了这里,关于数据仓库实验一:数据仓库建立实验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据仓库与数据挖掘小结

    更加详细的只找得到pdf版本  填空10分 判断并改错10分 计算8分 综合20分 客观题 填空10分 判断并改错10分--错的要改 mooc中的--尤其考试题   名词解释12分 4个,每个3分 经常碰到的专业术语 简答题40分 5个,每道8分 综合 画 roc 曲线 类似于和计算相关的题目 C1 什么是数据挖掘?

    2024年01月22日
    浏览(47)
  • 数据挖掘(7.1)--数据仓库

    目录 引言 一、数据库 1.简介 2.数据库管理系统(DBMS) 二、数据仓库 数据仓库特征 数据仓库作用 数据仓库和DBMS对比 分离数据仓库和数据库 数据仓库的历史可以追溯到20世纪60年代,当时计算机领域的主要工作是创建运行在主文件上的单个应用,这些应用以报表处理和程序为特

    2024年02月08日
    浏览(37)
  • 数据挖掘和数据仓库之间的区别

    数据仓库是一种用于收集和管理来自不同来源的数据以提供有意义的业务见解的技术。它是技术和组件的混合体,允许战略性地使用数据。 数据仓库是企业对大量信息的电子存储,旨在进行查询和分析,而不是事务处理。这是一个将数据转换为信息并将其提供给用户进行分析

    2024年02月04日
    浏览(45)
  • Python实现图书数据挖掘系统(数据仓库)

    目 录 摘 要 I Abstract II 第1章 绪论 1 1.1选题背景及意义 1 1.2国内外研究现状 1 1.3发展趋势 2 第2章 系统需求分析 3 2.1任务描述 3 2.2需求分析 3 2.3 系统目标 4 第3章 系统概要设计 5 3.1 系统用户分析 5 3.2 系统功能分析 6 3.3 系统算法分析 9 第4章 系统详细设计 12 4.1 数据管理 12 4.2

    2024年02月12日
    浏览(41)
  • 机器学习——数据仓库与数据挖掘——期末复习(简答题)

    1 、试述真正例率(TPR)、假正例率(FPR)与查准率(P)、查全率(R)之间的联系。 查全率: 真实正例被预测为正例的比例 真正例率: 真实正例被预测为正例的比例 查全率与真正例率是相等的。 查准率:预测为正例的实例中真实正例的比例 假正例率: 真实反例被预测为正例的

    2024年02月10日
    浏览(56)
  • 我的数据仓库与数据挖掘期末大作业重置版

    这是之前已经完成的任务,原本是我的数据仓库与数据挖掘课程的作业。里面都是比较入门的东西,没什么难度。之前学这门课的时候,上了一整个学期的课,几乎都在讲解数学原理。作为数学科目挂了四门的理工蠢材,我整个学期都听得云里雾里,到了学期末的时候突然告

    2024年02月04日
    浏览(45)
  • 机器学习——数据仓库与数据挖掘复习(选择题、判断题)

    1. 以下不是分类问题的是(  B )。 A. 用户流失模型 B. 身高和体重关系 C. 信用评分 D. 营销响应 2. 对于回归分析,下列说法错误的是( D ) A. 在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 B. 线性相关系数可以是正的,也可以是负的 C. 回归

    2024年02月06日
    浏览(54)
  • 数据仓库中的数据挖掘:探索新的方法和技术

    作者:禅与计算机程序设计艺术 引言 7.1 背景介绍 随着互联网和大数据时代的到来,各类企业面临着海量数据的积累和处理,数据仓库成为了满足这些需求的重要工具。数据仓库是一个大规模、集成了多个数据源的存储系统,旨在帮助用户进行数据的存储、查询和分析。数据

    2024年02月07日
    浏览(37)
  • 仓库运行状况如何得知?数据挖掘是关键!

    库存、订单、出入库记录、物流信息、货物状态等数据,是仓库管理的重要组成部分。 仓库数据的重要性 做好仓库数据管理对企业的重要性不言而喻。通过有效地管理数据,企业可以更好地了解市场需求和库存情况,快速响应市场变化,提高库存周转率和客户满意度;此外

    2024年02月10日
    浏览(41)
  • 数据仓库与数据挖掘(第三版)陈文伟思维导图1-5章作业

    决策支持系统经历了4个阶段。 1.基本决策支持系统 是在运筹学单模型辅助决策的基础上发展起来的,以模型库系统为核心,以多模型和数据库的组合形成方案辅助决策。 它开创了用计算机技术实现科学决策的时代。 2.智能决策支持系统 把基本决策支持系统和专家系统结合起

    2024年04月17日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包