软件架构师高级——3、数据库系统

这篇具有很好参考价值的文章主要介绍了软件架构师高级——3、数据库系统。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

• 数据库概述(★★★)

集中式数据库系统

•数据管理是集中的
•数据库系统的素有功能 (从形式的用户接口到DBMS核心)

者口集中在DBMS所在的计算机。

B/S结构

•客户端负责数据表示服务

•服务器主要负责数据库服务
•数据 和后端 库系统分为前
•ODBC、JDBC

并行数据库 •共享内存式
•无共享式
分布式数据库 • 物理上分布、逻辑上集中
• 物理上分布、逻辑上分布
•特点
- 透明性

• 数据库的结构与模式(★★★★)

软件架构师高级——3、数据库系统,数据库

数据库系统的三级模式

外模式
 

外模式(子模式、用户模式
描述用户看到或使用的那部分数据的逻辑结构,用户根据外模式用数据操作

语句或应用程序去操作数据库中的数据。
外模式主要描述组成用户视图的各个记录的组成、相互关系、数据项的特征

数据的安全性和完整性约束条件
 

概念模式
 

概念模式(模式、逻辑模式

整个数据库中数据库的逻辑结构,描述现实世界中的实体及其性质与联系,

定义记录、数据项、 数据的完整性约束条件及记录之间的联系,是数据项值的框架。
数据库系统概念模式通常还包含有访问控制、保密定义、完整性检查等方面的内容,以
及概念/物理之间的映射
概念模式是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
一个数据库只有一个概念模式

内模式
 

内模式是整个数据库的最低层表示,不同于物理层,它假设外存是一个
无限的线性地址空间。
内模式定义的是存储记录的类型、存储域的表示以及存储记录的物理
顺序,指引元、索引和存储路径等数据的存储组织。

内模式是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。

一个数据库只有一个内模式。

内模式、模式和外模式之间的关系如下:
(1)模式是数据库的中心与关键;
(2)内模式依赖于模式,独立于外模式和存储设备;
(3)外模式面向具体的应用,独立于内模式和存储设备;
(4)应用程序依赖于外模式,独立于模式和内模式。
 

• 数据库设计阶段(★★)

软件架构师高级——3、数据库系统,数据库

软件架构师高级——3、数据库系统,数据库

集成的方法:

  • 多个局部E-R图一次集成。
  • 逐步集成,用累加的方式一次集成两个局部E-R。

集成产生的冲突及解决办法:

  • 属性冲突:包括属性域冲突和属性取值冲突。
  • 命名冲突:包括同名异义和异名同义。
  • 结构冲突:包括同一对象在不同应用中具有不同的抽象,以及同一实体在不同局部E-R图中所包含的属性个数和属性排列次序不完全相同。

• ER模型 (★)

概念数据模型是按照用户的观点来对数据和信息建模,主要用于数据库设计。概念模型
主要用实体—联系方法(Entity-Relationship Approach)表示,所以也称 E-R 模型。

常用的基本数据模型有层次模型、网状模型、关系模型和面向对象模型

• 关系代数(★★★★)


 

计算两个关系在集合理论上的并集,即给出关系

R 和 S(两者有相同元/列
数), R∪ S 的元组包括 R 和 S 所有元组的集合

软件架构师高级——3、数据库系统,数据库


计算两个关系集合理论上的交集,即给出关系

R 和 S(两者有相同元/列数),
R∩ S 的元组包括 R 和 S 相同元组的集合,

软件架构师高级——3、数据库系统,数据库

计算两个关系的区别的集合,即给出关系 R 和 S(

两者有相同元/列数), R-S
的元组包括 R 中有而 S 中没有的元组的集合

软件架构师高级——3、数据库系统,数据库
 笛卡尔积


计算两个关系的笛卡尔乘积,令 R 为有 m 元的关系,

S 为有 n 元的关系,则 R× S 是 m+n 元的元组的集合,

其前 m 个元素来自 R 的一个元组,而后 n 个
元素来自 S 的一个元组

软件架构师高级——3、数据库系统,数据库
选择 从一个关系中抽取指明的属性(列)。令 R 为一个包含属性 A 的关系 软件架构师高级——3、数据库系统,数据库
投影
连接 θ连接从两个关系的笛卡儿积中选取属性之间满足一定条件的元组
软件架构师高级——3、数据库系统,数据库
除法 设有关系 R(X, Y)与关系 S(Z), Y 和 Z 具有相同的属性个数,且对应属性出
自相同域。关系 R(X, Y)÷S(Z)所得的商关系是关系 R 在属性 X 上投影的一个子集,该子
集和 S(Z)的笛卡尔积必须包含在 R(X, Y)中,记为 R÷S
软件架构师高级——3、数据库系统,数据库

• 规范化理论(★★★★★)

第一范式

1NF 是最低的规范化要求。如果关系 R 中所有属性的值域都是简单域,其元素(即属
性)不可再分,是属性项而不是属性组,那么关系模型 R 是第一范式的,记作 RÎ1NF。

软件架构师高级——3、数据库系统,数据库

软件架构师高级——3、数据库系统,数据库

第二范式

如果一个关系 R 属于 1NF,且所有的非主属性都完全依赖于主属性,则称之为第二范
式,记作 RÎ2NF

有一个获得专业技术证书的人员情况登记表结构为:

省份、姓名、证书名称、证书编号、核准项目、发证部门、发证日期、有效期。

这个结构符合 1NF,其中“证书名称”和“证书编号”是主码,但是因为“发证部门”
只完全依赖于“证书名称”,即只依赖于主关键字的一部分(即部分依赖),所以它不符合 2NF,

分解成两个表就完全符合 2NF 了

省份、姓名、证书名称、证书编号、核准项目、发证日期、有效期

证书名称、发证部门

第三范式

如果一个关系 R 属于 2NF,且每个非主属性不传递依赖于主属性,这种关系是 3NF,
记作 RÎ3NF。

有一个表(职工姓名,工资级别,工资额),
其中职工姓名是关键字,此关系符合 2NF,但是因为工资级别决定工资额,也就是说非主
属性“工资额”传递依赖于主属性“职工姓名”,它不符合 3NF,同样可以使用投影分解的

办法分解成两个表:(职工姓名,工资级别),(工资级别,工资额)。

BC 范式

如果关系模型 R∈ 1NF,且 R 中每一个函数依赖关系中的决定因素都
包含码,则 R 是满足 BC 范式的关系,记作 RÎBCNF。

综合 1NF、 2NF 和 3NF、 BCNF 的内涵可概括如下:
(1)非主属性完全函数依赖于码(2NF 的要求);
(2)非主属性不传递依赖于任何一个候选码(3NF 的要求);
(3)主属性对不含它的码完全函数依赖(BCNF 的要求);
(4)没有属性完全函数依赖于一组非主属性(BCNF 的要求)。
 

• 并发控制(★)

数据库的并发操作带来的问题有:丢失更新问题、不一致分析问题(读过时的数据)、依赖
于未提交更新的问题(读了“脏”数据)。这三个问题需要 DBMS 的并发控制子系统来解决。

处理并发控制的主要方法是采用封锁技术。它有两种类型:排他型封锁(X 封锁)和共
享型封锁(S 封锁)

(1)排他型封锁(简称 X 封锁)。如果事务 T 对数据 A(可以是数据项、记录、数
据集,乃至整个数据库)实现了 X 封锁,那么只允许事务 T 读取和修改数据 A,其他事
务要等事务 T 解除 X 封锁以后,才能对数据 A 实现任何类型的封锁。可见 X 封锁只允
许一个事务独锁某个数据,具有排他性。

(2)共享型封锁(简称 S 封锁)。 X 封锁只允许一个事务独锁和使用数据,要求太严。
需要适当放宽,例如可以允许并发读,但不允许修改,这就产生了 S 封锁概念。 S 封锁的
含义是:如果事务 T 对数据 A 实现了 S 封锁,那么允许事务 T 读取数据 A,但不能修
改数据 A,在所有 S 封锁解除之前绝不允许任何事务对数据 A 实现 X 封锁。
 

• 分布式数据库(★★)

分布式数据库=是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力,成为场地自治,它可以执行局部应用,同时,每个结点也能通过网络通信子系统执行全局应用。


软件架构师高级——3、数据库系统,数据库

 图 3-8 的模式结构从整体上可以分为两大部分:下半部分是集中式数据库的模式结构,
代表了各局部场地上局部数据库系统的基本结构;上半部分是分布式数据库系统增加的模式
级别。

• 数据仓库(★★★)

著名的数据仓库专家 W.H.Inmon 在《Building the Data Warehouse》一书中将数据仓库
定义为:数据仓库( Data Warehouse)是一个面向主题的、集成的、相对稳定的、且随时间
变化的数据集合,用于支持管理决策。

软件架构师高级——3、数据库系统,数据库

• 数据挖掘(★★★★)

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际
应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘的功能

  • 1.自动预测趋势和行为数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
  • 2.关联分析数据关联是数据库中存在的一类重要的可被发现的知识。
  • 3.聚类数据库中的记录可被划分为一系列有意义的子集,即聚类。
  • 4.概念描述概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。
  • 5.偏差检测数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。
     

常用的数据挖掘技术包括关联分析、序列分析、分类、预测、聚类分析时间序列分析

 

• 大数据(★★★)

业界通常用 4 个 V(即 Volume、 Variety、 Value、 Velocity)来概括大数据的特征

Volume:指的是数据体量巨大,从 TB 级别跃升到 PB 级别(1PB=1024TB)、 EB 级别
1EB=1024PB),甚至于达到 ZB 级别(1ZB=1024EB)。截至目前,人类生产的所有印刷材
料的数据量是 200PB,而历史上全人类说过的所有话的数据量大约是 5EB。当前,典型个
人计算机硬盘的容量为 TB 量级,而一些大企业的数据量已经接近 EB 量级。

Variety:指的是数据类型繁多。这种类型的多样性也让数据被分为结构化数据和非结构
化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网
络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了
更高要求。

Value:指的是价值密度低。价值密度的高低与数据总量的大小成反比。以视频为例,
一部 1 小时的视频,在连续不间断的监控中,有用数据可能仅有 1-2 秒。如何通过强大的
机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。当然把
数据集成在一起,并完成“提纯”是能达到 1+1 大于 2 的效果的,这也正是大数据技术的
核心价值之一。

Velocity:指的是处理速度快。这是大数据区分于传统数据挖掘的最显著特征。根据 IDC
的“数字宇宙”的报告, 预计到 2020 年,全球数据使用量将达到 35.2ZB。在如此海量的
数据面前,处理数据的效率就是企业的生命。
 

软件架构师高级——3、数据库系统,数据库

 大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数
分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全
等)文章来源地址https://www.toymoban.com/news/detail-629689.html

• 数据库完整性约束(★)

• 数据库备份与安全 (★)

到了这里,关于软件架构师高级——3、数据库系统的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux高级管理--安装MySQL数据库系统

            MySQL.是一个真正的多线程、多用户的SQL数据库服务,凭借其高性能、高可靠和易于使 用的特性,成为服务器领域中最受欢迎的开源数据库系统。在2008年以前,MySOL项目由MySQL AB公司进行开发,发布和支持,之后历经Sun 公司收购MySOL AB公司,Oracle公司收购Sun公司 的

    2024年02月04日
    浏览(59)
  • 系统架构:数据库

    步骤 产出 说明 1.根据数据要求和处理要求进行需求分析 数据流图、数据字典、需求说明书等 分析数据流向、数据详细含义等,分析具体需求 2.对现实世界进行抽象,进行概念结构设计 ER模型 用于描述实体及各实体的联系 3.加入转换规则、规范化理论和DBMS特性等进行逻辑结

    2024年02月11日
    浏览(44)
  • 【系统架构】第六章-数据库设计基础知识(数据库设计)

    软考-系统架构设计师知识点提炼-系统架构设计师教程(第2版) 第一章-绪论 第二章-计算机系统基础知识(一) 第二章-计算机系统基础知识(二) 第三章-信息系统基础知识 第四章-信息安全技术基础知识 第五章-软件工程基础知识(一) 第五章-软件工程基础知识(需求工

    2024年02月11日
    浏览(49)
  • 【新版】系统架构设计师 - 数据库系统

    个人总结,仅供参考,欢迎加好友一起讨论 数据库模式(★) 分布式数据库(★★★) 数据库设计阶段(★★) 概念结构设计 - ER模型(★) 逻辑结构设计 - 关系模式(★★) 关系代数(★★★★) 规范化理论(★★★★★) 并发控制(★) 数据库的安全性(★) 数据

    2024年02月09日
    浏览(59)
  • 系统架构12 - 数据库基础(下)

    数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间联系和约束的抽象,是数据内在的性质,是语义的体现。函数依赖则是一种最重要、最基本的数据依赖。 给定一个X,能唯一确定一个Y,就称X决定(确定)Y,或者说Y依赖于X。 例如

    2024年01月22日
    浏览(43)
  • 系统架构11 - 数据库基础(上)

    数据 :是数据库中存储的基本对象,是描述事物的符号记录。 数据的分类 :文本、图形、图像、音频、视频等。 数据库 (DataBase,DB):是统一管理的、长期储存在计算机内的,有组织的相关数据的集合。其特点是 数据间联系密切、冗余度小、独立性较高、易扩展,并且可

    2024年01月16日
    浏览(38)
  • 【数据库系统】--【2】DBMS架构

    数据库系统的体系结构 数据库集群(一) 数据库集群(二) DBMS的运行架构 DBMS的数据架构 PostgreSQL的体系结构 处理DML语句 COMMIT处理 RMDB的运行架构 DBMS的层次结构 DBMS的开发架构 DBMS的代码架构 ● DBMS的系统架构 -软件架构的5视图 ● DBMS的物理架构 ● DBMS的运行和数据结构

    2024年02月12日
    浏览(42)
  • 银河麒麟高级服务器操作系统V10安装mysql数据库

    1.检查是否已经安装mysql 2.将查询出的包卸载掉 3.将/usr/lib64/libLLVM-7.so删除 4.检查删除结果 5.搜索残余文件 6.删除残余文件 7.验证删除 8.检查MySQL用户组以及用户是否存在,若没有则创建 9.上传安装包 将mysql-8.0.33-linux-glibc2.17-x86_64-minimal.tar安装包上传到银河麒麟系统虚拟机中

    2024年02月16日
    浏览(94)
  • 软考系统架构师知识点集锦九:数据库系统

    2.1.1数据库模式 (1)三级模式:外模式对应视图,模式(也称为概念模式)对应数据库表,内模式对应物理文件。 (2)两层映像:外模式-模式映像,模式-内模式映像;两层映像可以保证数据库中的数据具有较高的逻辑独立性和物理独立性。 (3)物理独立性:即数据库的内模式发生改变时,

    2024年02月07日
    浏览(47)
  • [架构之路-174]-《软考-系统分析师》-5-数据库系统-7-数据仓库技术与数据挖掘技术

    数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。近年来,人们对数据仓库技术的关注程度越来越尚,其原因是过去的几十年中 ,建设了无数的应用系统,积累了大量的数据,但这些数据没有得到很好的利用,有时反而成为企

    2023年04月23日
    浏览(66)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包