如何为每个字段的多个数据值构建和规范化数据以获取可搜索性?

时间:2011-12-01 13:51:31

标签: database-design database-schema

我正在尝试为归档目的制定数据库结构。该应用程序旨在存储数据,以实现易于搜索的速度和未来可扩展性的主要目的。

例如,具有n-main类型数据的数据库,例如,ARTICLE(数据库的主要内容),日记,作者等,每个数据库都有自己的表和ID。但每篇文章可能有超过1位作者,并且可能已发表在1本以上的期刊上。然后还有与每个文章相关的内容信息相关的标签。

数据库需要通过单个标签(也可以是分层标签,例如Wing Design> Swept Wing),“期刊”,“作者”等进行搜索,并且这些标签中没有一个可能对有多少标签有关每个'ARTICLE'。

在这种情况下,归一化是可能的还是可取的?管道/空间分离数据是否足够?这样做的最佳方式是什么?

提前致谢! :)

编辑:添加一些说明:我在这个应用程序中使用MySQL。此外,除了文章之外的所有n-main类型数据(即'author','journal','tagset1','tagset2'...'tagset-n'等都处于数据层次和可搜索性需求的同一级别)

1 个答案:

答案 0 :(得分:0)

  

在这种情况下,归一化是可能的还是可取的?

当然。我希望5NF很容易实现,并且表现也很好。标准化取决于属性之间的某些依赖关系,而不是主题区域,因此您可以将这些表标准化,就像您为谷物,汽车制造商,法律案例管理或食谱规范化表格一样。

作者是否最终决定了标题是什么,还是做期刊?如果是作者,那么每篇文章只有一个标题。如果是期刊,那么每篇文章都会有很多不同的标题,你的数据录入工作会变得更加困难。