概述

信息与数据

  • 信息:用于反映现实世界中事物的物理状态,向人们提供一些已知的、客观存在的事实和知识
  • 数据:是指具有一定的语义含义,并且可以被记录下来的已知事实(在计算机世界中是具有一定结构的格式串)
    数据是信息的载体,信息是数据的内涵

数据库系统的基本特点

  • 数据的集成性
  • 数据的高共享性与低冗余性
  • 数据独立性
  • 数据的统一管理与控制

三种语言

  • DDL:数据定义语言
  • DML:数据操作语言
  • DCL:数据控制语言

数据库的三级模式

  • 概念模式(简称模式)(是关于整个数据库中数据的全局逻辑结构的描述,是面向数据库系统的,它一般以某种数据模型为基础,利用具体的DBMS所提供的数据定义语言(DDL)来描述)
  • 外模式(也称子模式、用户模式)(是关于某个用户所需数据的逻辑结构的描述)
  • 内模式(也称物理模式)(是关于数据库中数据的物理存储结构和物理存取方法的描述)

在这三种数据库中,只有物理数据库是真实存在于计算机的外存中的,其他两种数据库并不真正存在于计算机中,而是由物理数据库通过数据库管理系统构造而成的

三级模式的两级映射

  • 从概念模式到内模式的映射由DBMS完成,实现了物理独立性
  • 外模式到概念模式的映射是由试图完成的,每个外模式都是概念模式的一个子集,该方法实现了逻辑独立性,也由DBMS实现

数据模型

定义:描述数据的结构,定义在该数据结构上可以执行的操作以及数据之间必须满足的约束条件

组成成分:

  • 数据结构
  • 数据操作
  • 数据约束

数据模型的三种层次

  1. 概念数据模型(例如E-R模型,EE-R模型,面向对象模型,谓词模型)
  2. 逻辑数据模型(使用DBMS中的DDL来定义数据)
  3. 物理数据模型(给出了数据模型在计算机内部的真正物理结构,是一种面向计算机物理实现的模型)

数据模型的四个世界

定义为:

  • 现实世界
  • 概念世界
  • 信息世界
  • 计算机世界
    这个和上面数据库的三级模式的对应关系如下:

现实世界

在客观世界中根据用户的需求目标而划定边界的一个应用环境

概念世界

以现实世界为基础作进一步的抽象而形成的概念模型,在这一层次的属于是 E-R 模型中的实体、关系、属性,OO模型中的对象、类、方法

信息世界

以概念世界为基础,选用特定的DBMS构造而成的逻辑数据模型

计算机世界

基于逻辑数据模型在计算机中的物理实现而形成的物理数据模型

侧重:储存结构的设计、存取路径的设计、集簇、索引的设计

E-R模型

这个属于概念模型,详情略
重点:

这个里面是一个仓库有多个职工

EE-R模型

主要拓展了两个东西,一个是IS-A的继承,一个是弱实体,下面给两个例子

关键字

关系中的一个属性集的值能唯一标识关系中的一个元组,且又不含多余的属性值,则称该属性集为该关系的关键字

在一个关系中至少有一个关键字,也可能有多个关键字,此时的关键字称为候选关键字

主关键字

在候选关键字里面选一个出来,作为表示该关系的标识符称为主关键字

外关键字

如果关系R中的属性集F取值来自关系S中的主关键字则称R为外关键字