就业数据资源平台
当前位置:首页 > 数据库技术
三级数据库第四章考试要点

  第四章
一、数据库基本概念(一)信息、数据与数据处理
1.信息(information)
信息是现实世界事物的存在方式或运动状态的反映。
2.数据(data)
数据是描述现实世界的符号记录,是指用物理符号记录下来的可以鉴别的信息。
3.信息与数据的关联
数据是信息的符号表示,或称载体;信息是数据的内涵,是数据的语义解释。
4.信息处理
人们将原始信息表示成数据称为源数据,然后对这些源数据进行汇集、存储、综合、推导,从这些原始的、杂乱的、难以理解的数据中抽取或推导出新的数据,这些新的数据称为结果,结果数据对某些特定的人们来说是有价值的、有意义的,表示了新的信息,可以作为某种决策的依据或用于新的推导。这一过程通常称为数据处理或信息处理。
(二)数据管理技术的发展与数据库技术的产生
数据管理技术是指对数据的分类、组织、编码、存储、检索和维护的技术。数据管理技术的发展经历了如下3个阶段:
1.人工管理阶段
人工管理数据的特点是:
(1)数据不保存。
(2)数据无专门软件进行管理。
(3)数据不共享。
(4)数据不具有独立性。
2.文件系统阶段
该阶段的数据管理具有如下特点:
(1)数据可以长期保存。
(2)由文件系统管理数据。文件系统管理数据存在如下缺点:
(1)数据共享性差,数据冗余度大。
(2)数据独立性差。 
3.数据库系统阶段
与人工管理和文件系统阶段相比较,数据库系统阶段具有如下的特点:
(1)数据结构化
(2)数据共享性高、冗余度小、易扩充
(3)数据独立性高
(4)统一的数据管理和控制数据库管理系统必须提供以下几个方面的数据控制和保护功能:
(1)数据的安全性(security)保护。
(2)数据的完整性(integrity)控制。
(3)数据库恢复(recovery)。
(4)并发(concurrency)控制。
(5)事务(transaction)支持。
(三)数据库、数据库管理系统、数据库系统
数据库、数据库管理系统和数据库系统是与数据库技术密切相关的3个基本概念。
1.数据库(DB,DataBase)
数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度,较高的数据独立性和易扩展性,并可为一定范围内的各种用户共享。
2.数据库管理系统(DBMS,DataBase Management System)
数据库管理系统是位于用户与操作系统之间的一个数据管理软件,它的基本功能包括以下几个方面:
(1)数据定义功能
(2)数据操纵功能
(3)数据库的运行管理
(4)数据库的建立和维护功能3.数据库系统(DBS,DataBase System)数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、操作系统、数据库管理系统(及其工具)、应用系统、数据库管理员和用户构成。
(1)数据库系统中的计算机硬件平台:①要有足够大的内存,存放操作系统、DBMS的核心模块、数据缓冲区和应用程序。②有足够大的磁盘等直接存取设备存放数据库,有足够的磁带(或微机软盘)做数据备份。③要求系统有较高的通信能力,以提高数据传送率。
(2)数据库系统中的计算机软件:①DBMS为数据库的建立、使用和维护配置的软件。②支持DBMS运行的操作系统(OS)。③具有与数据库接口的高级语言及其编译系统,便于开发应用程序。④以DBMS为核心的应用开发工具。⑤为特定应用环境开发的数据库应用系统。
(3)人员:数据库管理员、系统分析员和数据库设计人员、应用程序员和最终用户。①数据库管理员具体的职责包括:(a)决定数据库中的信息内容和结构。(b)决定数据库的存储结构和存取策略。(c)定义数据的安全性要求和完整性约束条件。(d)监控数据库的使用和运行。(e)数据库的性能改进。(f)定期对数据库进行重组和重构,以提高系统的性能。②系统分析员和数据库分析人员:系统分析员负责应用系统的需求分析和规范说明。数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。③应用程序员:应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。④用户:这里用户是指最终用户(End User)他们通过应用系统的用户接口使用数据库。
(四)数据库技术的研究领域1.数据库管理系统软件的研制
研制的目标是提高系统的可用性、可靠性、可伸缩性,提高系统性能和提高用户的生产率。
2.数据库设计
主要任务是在DBMS的支持下,按照应用的要求,为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。
3.数据库理论
数据库理论的研究主要集中于关系的规范化理论、关系数据理论等。
二、数据模型(一)数据模型的概念
数据模型是数据库系统的数学形式框架,是用来描述数据的一组概念和定义,包括描述数据、数据操作、数据定义以及数据一致性概念的工具,即:①数据的静态特征,它包括对数据结构和数据间联系的描述。②数据的动态特征,一组定义在数据上的操作包括操作的含义、操作符、运算规则及其语言等。③数据的完整性约束,这是一组规则,数据库中的数据必须满足这组规则。根据模型应用的不同目的,可以将这些模型划分为两类。第一类模型是概念模型,也称信息模型,它是按用户的观点对数据和信息建模。另一类模型是结构模型,主要包括网状模型、层次模型、关系模型和面向对象模型等,它是按计算机系统的观点对数据建模。

(二)数据模型的要素1.数据结构
数据结构用于描述系统的静态特性。在数据库系统中,通常按照其数据结构的类型来命名数据模型。
2.数据操作
数据操作用于描述系统的动态特征。数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。 
3.数据完整性约束
数据完整性约束是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。数据模型应该反映和规定本数据模型必须遵守的、基本的、通用的完整性约束。此外,数据模型还应该提供定义完整性约束的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束。
(三)概念模型---E-R模型
1.信息世界中的基本概念
信息世界涉及的概念主要有:
(1)实体(entity)客观存在并可相互区别的事物称为实体。实体可以是具体的人、事、物,也可以是抽象的概念或联系。
(2)属性(attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。
(3)主码(primary key)惟一标识实体的属性集称为码。
(4)域(domain)属性的取值范围称为该属性的域。
(5)实体型(entity type)具有相同属性的必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。
(6)实体集(entity set)同型实体的集合称为实体集。
(7)联系(relationship)实体内部的联系通常是指组成实体的各属性之间的联系。两个实体型之间的联系可以分为3类:①一对一联系(1:1)②一对多联系(1:n)③多对多联系(m:n)
2.概念模型的表示方法
P.P.S.Chen于1976年提出的实体-联系方法(Entitry-Relationship Approach)。用E-R图来描述现实世界的概念模型,为实体-联系模型(Entiry-Relationship Model)简称E-R模型。E-R图提供了表示实体型、属性和联系的方法。①实体型:用矩形表示,矩形框内写明实体名。②属性:用椭圆形表示,椭圆形框内写明属性名,并用无向边将其与相应的实体连接起来。③联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关的实体连接起来,同时在无向边旁标注上联系的类型(1:1,1:n或m:n)。需要注意的是,联系本身也可以有属性。如果一个联系有属性,则这些属性也要用无向边与该联系连接起来。E-R模型有两个明显的优点:①接近人的思想,容易理解。②与计算机无关,用户容易接受,因此,E-R模型已经成为数据库概念设计的一个重要的设计方法。
(四)常用的数据结构模型1.层次模型(hierarchical model)
层次模型是数据库系统中最早出现的数据模型,层次数据库系统采用层次模型作为数据的组织方式。用树型(层次)结构表示实体类型以及实体间的联系是层次模型的主要特征。层次结构是一棵有向树,树的结点是记录类型,根结点以外的结点有且只有一个父结点,上一层记录类型和下一层记录类型间的联系是1:m联系(包括11联系)。层次模型的另一个最基本的特点是,任何一个给定的记录值只有按其路径查看时,才能显出它的全部意义,没有一个子记录值能够脱离双亲记录值而独立存在。
2.网状模型(network model)
用网状结构表示实体类型及实体之间联系的数据模型称为网状模型。在网状模型中,一个子结点可以有多个父结点,在两个结点之间可以有一种或多种联系,网状模型实现实体间m:n联系比较容易。记录之间联系是通过指针实现的,因此,数据的联系十分密切。在网状模型中任意两个记录类型之间都可以组成一个系类型结构。因此,以记录类型为结点的结构图是网状结构。从E-R图到网状模型的转换规则主要有两条:①把E-R图的实体类型和联系类型全部转换成相应的记录类型。②把E-R图的实体类型与有联系的每个联系类型,在网状模型中要组成一个系类型。网状数据库系统采用网状模型作为数据的组织方式。
3.关系模型(relational model)
用表格形式结构表示实体类型以及实体间联系的模型称为关系模型。关系模型比较简单,容易为初学者接受。关系在用户看来是一个表格,记录是表中的行,属性是表中的列。4.面向对象模型(object-oriented model)面向对象数据模型的核心概念:
(1)对象和对象标识(OID):对象是现实世界中实体的模型化,与记录、元组的概念相似,但远比它们复杂。每一个对象都有一个惟一的标识,称为对象标识(OID)。对象标识OID不等于关系模式中的记录标识RID或元组标识TID。OID是独立于值的,全系统惟一的。
(2)封装(encapsulate):每一个对象是状态(state)和行为(behavior)的封装。对象的状态是该对象属性的集合。对象的行为是在该对象状态上操作的方法(程序代码)的集合。被封装的状态和行为在对象外部是看不见的,只能通过显式定义的消息传递来访问。
(3)对象的属性(object attribute):对象的属性描述对象的状态、组成和特性,对象的某个属性可以是单值或值的集合。对象的一个属性值本身在该属性看来也是一个对象。
(4)类和类层次(class and class hierarchy)①类:所有具有相同属性和方法的对象构成了一个对象类。任何一个对象都是某个对象类的一个实例(instance)。对象类中属性的定义域可以是任何类,包括:基本类 整型,实型,字串等。一般类 包含自身属性和方法类本身。②类层次 所有的类组成了一个有根有向无环图,称为类层次(结构)。一个类可以从直接/间接祖先(超类)中继承(inherit)所有的属性和方法,该类称为子类。

(5)继承(inherit):子类可以从其超类中继承所有属性和方法。类继承要分为:单继承(即一个类只能有一个超类)和多重继承(即一个类可以有多个超类)。
三、数据库系统的模式结构
数据库系统的结构按考虑的层次和角度的不同而不同,一般有如下两种:①从数据库管理系统角度看,数据库系统通常采用外模式、模式、内模式三级模式结构。②从数据库计算机系统角度看,数据库系统的结构分为集中式结构、分布式结构、客户/服务器结构和多层客户机/服务器结构等。
(一)数据库系统中模式的概念
在数据模型中有“型”(type)和“值”(value)的概念。型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。模式(schema)是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例(instance)。同一个模式可以有很多实例。模式是相对稳定的,而实例是相对变动的,因为数据库中的数据是在不断更新的,模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
(二)数据库系统的三级模式结构
1.模式(schema)
模式也称逻辑模式或概念模式,是数据库中全体数据的逻辑结构的特征的描述,是所有用户的公共数据视图。模式实际上是数据库数据在逻辑层上的视图。一个数据库只有一个模式。数据库模式以某一种数据模型为基础,统一综合地考虑了所有用户的需求,并将这些需求有机地结合成一个逻辑整体。定义模式时不仅要定义数据的逻辑结构,例如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等,而且要定义数据之间的联系,定义与数据有关的安全性、完整性要求。DBMS提供模式数据定义语言DDL来描述逻辑模式,即严格地定义数据的名称、特征、相互关系、约束等。逻辑模式的基础是数据模型。
2.外模式(external schema)
外模式也称子模式(subschema)或用户模式,它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
3.内模式(internal schema)
内模式也称物理模式或存储模式(storge schema),一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据库内部的表示方法。
(三)数据库的二层映像与数据独立性1.外模式/模式映像
模式描述的是数据库数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。对应于同一个模式可以有任意多个外模式。对于每个外模式,数据库系统都有一个外模式/模式映像,它定义该外模式与模式之间的对应关系。这些映像定义通常包含在各自外模式的描述中。
2.模式/内模式映像
数据库中只有一个模式,也只有一个内模式,所以模式/内模式映像是惟一的,它定义数据库全局逻辑结构与存储结构之间的对应关系。在数据库的三级模式结构中,数据库模式即全局逻辑结构是数据库中的关键,它独立于数据库的其他层次。因此,设计数据库模式结构时应首先确定数据库的逻辑模式。
数据库的内模式依赖于它的全局逻辑结构,但独立于数据库的用户视图即外模式,也独立于具体的存储设备。它是将全局逻辑结构中定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率。
数据库的外模式面向具体的应用程序,它定义在逻辑模式之上,但独立于存储模式和存储设备。当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动,所以设计外模式时应充分考虑到应用的扩充性。
就业数据资源平台