本文共 2114 字,大约阅读时间需要 7 分钟。
设计数据库时,需要遵循的一些规范。要遵循后边的范式要求,必须先遵循前边的所有范式要求
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
每一列都是不可分割的原子数据项
在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)
几个概念∶
1,函数依赖: 函数依赖:A–>B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则称B依赖于A
例如1:学号–>姓名。 通过学号,可以确定唯一的姓名
(学号,课程名称) --> 分数。通过(学号,课程名称)属性组可以确定唯一的分数
2,完全函数依赖∶
A – >B, 如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值。
例如:(学号,课程名称) --> 分数。分数的确定需要依赖于属性组的所有属性,这就是完全函数依赖。
3,部分函数依赖∶
A–>B, 如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某一些值即可。
例如:(学号,课程名称) – > 姓名。其实通过学号就能确定唯一的姓名,不需要整个属性组。
4,传递函数依赖:
传递函数依赖:A–>B,B – >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A
例如:学号–>系名,系名–>系主任。通过学号能确定唯一的系名,通过系名能确定唯一的系主任
5,码︰ 如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性组)为该表的码
例如:该表中码为:(学号,课程名称)。通过(学号,课程名称)能唯一确定所有属性,因此成为码
主属性:码属性组中的所有属性
非主属性:除过码属性组的属性
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
这样就解决力第一范式的问题。
但是,我们发现这个表存在严重的问题:
1. 数据冗余严重。
2. 如果我们想添加系信息,我们还必须添加学生信息才能补全所有信息,也就是说,系的存在依赖于学生,这显然是不合理的,因此存在添加信息问题。
3. 删除信息也不行,我们发现,如果要删除一个学生信息,整个系都会被删除,所以存在删除问题。
接下来解决第二范式的问题,即在1NF的基础上,非码属性必须完全函数依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)。
这里说的是非码属性必须完全函数依赖于码,那我们分析整张表那一列不是完全函数依赖于码,这张表的码是(学号,课程名称),我们发现,给出学号,就能找到唯一的姓名,唯一的系,和唯一的系主任,这些都是部分函数依赖,因此我们需要消除这些部分函数依赖。
也就是消除一个学号就能唯一确定的字段,这里我们将姓名,系名,系主任提出另做一表。
这里我们消除了部分函数依赖,也就实现了非主属性完全函数依赖于主属性。
但是,我们发现,虽然消除了数据的冗余,这里仍然存在着问题:
如果我们向第二章表添加系信息,发现还需要添加学生信息,但是系的存在是不依赖于学生而存在的,因此添加信息存在问题。
2. 如果我们想删除学生信息,我们发现系的信息也会被删除,系的信息还是没有独立于学生而存在,因此表的信息删除存在问题。
现在我们解决第三范式的问题,即在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
任何非主属性不依赖于其它非主属性,也就是说非主属性,只依赖于主属性,在概念中我们了解到,传递函数依赖:
A–>B,B – >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A
我们发现,B并非主属性,要使任何非主属性不依赖于任何非主属性,也就是解决传递函数依赖问题,那我们现在分析谁传递函数依赖于谁
我们发现一个学号,能确定一个系名,一个系名能确定一个系主任,这三者之间存在着函数依赖问题,因此,我们需要解决这些函数依赖。
将学号–>系名–>系主任所存在的表的这三个字段,拆分成两张表,也就解决了表中存在的传递函数依赖问题。
到这里我们分析表中存在的问题:
到这里,我们完成了三大范式所规定的所有内容,表中存在的问题基本被解决。
转载地址:http://kboen.baihongyu.com/