在关系数据库设计中,存在数据库规范化或简单规范化的概念,这是组织列(属性)和表(关系)以减少数据冗余和提高数据完整性的过程。 (如Wikipedia所述)。
由于大多数文章都有些技术性而且难以理解,我要求有人根据1NF,2NF,3NF甚至3.5NF(Boyce-Codd)的含义的例子写一个更容易理解的解释。 / p>
答案 0 :(得分:418)
1NF是最基本的普通表格 - 表格中的每个单元格必须只包含一条信息,并且不能有重复的行。
2NF和3NF都依赖于主键。回想一下,主键可以由多列组成。克里斯在回答中说:
数据取决于键[1NF],整个键[2NF],只有键[3NF](所以帮助我Codd)。
假设您有一个包含某个学期课程的表格,并且您拥有以下数据:
|-----Primary Key----| uh oh |
V
CourseID | SemesterID | #Places | Course Name |
------------------------------------------------|
IT101 | 2009-1 | 100 | Programming |
IT101 | 2009-2 | 100 | Programming |
IT102 | 2009-1 | 200 | Databases |
IT102 | 2010-1 | 150 | Databases |
IT103 | 2009-2 | 120 | Web Design |
这是不在2NF ,因为第四列不依赖于整个键 - 而只是它的一部分。课程名称取决于课程的ID,但与学习的学期无关。因此,正如您所看到的,我们有重复的信息 - 几行告诉我们IT101正在编程,IT102是数据库。所以我们通过将课程名称移动到另一个表来解决这个问题,其中CourseID是ENTIRE键。
Primary Key |
CourseID | Course Name |
---------------------------|
IT101 | Programming |
IT102 | Databases |
IT103 | Web Design |
没有冗余!
好的,我们也可以说我们还将课程老师的名字及其中的一些细节添加到RDBMS中:
|-----Primary Key----| uh oh |
V
Course | Semester | #Places | TeacherID | TeacherName |
---------------------------------------------------------------|
IT101 | 2009-1 | 100 | 332 | Mr Jones |
IT101 | 2009-2 | 100 | 332 | Mr Jones |
IT102 | 2009-1 | 200 | 495 | Mr Bentley |
IT102 | 2010-1 | 150 | 332 | Mr Jones |
IT103 | 2009-2 | 120 | 242 | Mrs Smith |
现在希望很明显,TeacherName依赖于TeacherID - 所以这是不在3NF 。要解决这个问题,我们会像在2NF中那样做很多事情 - 从这个表中取出TeacherName字段,并将其放在自己的字段中,其中以TeacherID为键。
Primary Key |
TeacherID | TeacherName |
---------------------------|
332 | Mr Jones |
495 | Mr Bentley |
242 | Mrs Smith |
没有冗余!!
要记住的一件重要事情是,如果某些东西不在1NF中,它也不在2NF或3NF中。因此,每个额外的普通表格都需要所有以及更低的正常形式,以及一些额外的条件,这些条件必须全部才能实现。
答案 1 :(得分:115)
对于确切的措辞,我从未有过良好的记忆,但在我的数据库课中,我认为教授总是这样说:
数据取决于键[1NF],整个键[2NF],只有键[3NF]。
答案 2 :(得分:44)
这是一个快速的,无可否认的屠杀回复,但在一句话中:
1NF:您的表格被组织为无序的集数据,并且没有重复的列。
2NF:由于另一列,您不会在表的一列中重复数据。
3NF:表格中的每一列都只与您的表格密钥相关 - 您在表格中没有一列描述表格中不是关键字的另一列。
有关详细信息,请参阅维基百科...
答案 3 :(得分:31)