我想弄清楚我正在制作的数据库使用什么样的规范化和结构。它将是一个属性列表(建筑物编号街道地址,街道名称,城市,州,邮政编码,单元号)。
从那里开始,我打算用各种信息制作一张桌子。然后我将有一个中间表来加入所有信息并进行记录。据我所知,除了单位数之外,几乎所有列都是多值的。所以,我认为需要完全规范化:
Table building_number
---------------------
building_number_id int primary key auto index not null
buildind_namber tinyint
Table city
--------------------
city_id building_number_id int primary key auto index not null
city_name varchar(30)
Table state
--------------------
state_id building_number_id int primary key auto index not null
state_name varchar(30)
Table zip
---------------------
zip_id building_number_id int primary key auto index not null
zip_name varchar(30)
Table building_name
---------------------
building_name_id int primary key auto index not null
building_name varchar(50)
Table owner
---------------------
owner_id int primary key auto index not null
owner_name varchar(30)
Table info
----------------------
info_id int primary key auto index not null
rent tinyint
condition varchar(10)
comment varchar(1000)
Intermediate table
--------------------------
building_number_id int
street_id int
city_id int
state_id int
building_name_id
owner_id
info_id
(all these keys are foreign keys referencing their respected tables/primary keys)
我将创建一个html搜索文本框,它将根据提供的内容进行动态输入和提取查询...完整的确切地址,街道名称或建筑物编号街道名称城市等。我还没有开发我的搜索mysql算法呢。我刚刚开始创建数据库。
我将使用innodb引擎和b-tree索引。我将对除评论之外的每一列编制索引,因为我将进行这些动态输入搜索(如谷歌)。
我作为业余爱好者为自己做这件事。因此,我更喜欢从头开始,而不是使用一些框架或插件。
对于我正在做的事情,这个数据库设计和规范化是否正确?
答案 0 :(得分:1)
当你创建表格时,你应该首先考虑实体,一般而言,实体是一个有形的东西。
有形物品的例子有:建筑物,业主,联系人,城市,国家,时区。
另一方面,有些东西不是实体,而是实体的描述符。
描述符示例包括:身高,体重,门号和价格。
描述符通常是实体的属性。如果无法提前枚举所有可能的描述符,则这些描述符可能不在表格中。
您希望查找描述符表的情况通常是您可以接受的值类型受限制的地方。例如,“鞋子尺寸”可能看似开放式,但也许您只制造某些尺寸,因此自由形式的输入字段不实用。另一方面,“高度”最好存储为具有预定义单位集的值,而不是具有所有可能高度的查找表。
在您的情况下,您需要一个“地址”实体,其中包含许多描述它的字段。像“建筑物编号”这样的东西应该是一个自由形式的输入字段。 “建筑物A”,“82 1/2”,“107B”,“3.7”,“4/9”和“44-290”都是有效的建筑物编号。你应该接受一个字符串。
同样,街道名称几乎不是你可以获得的资格。 “Green Way Street”和“Green Way St.”一样吗还是“Greenway St.”?有关系吗?可能不是,因为它只是一个描述符。你无法验证这些,并将它们连接在一起几乎是不可能的,需要进行太多的按摩才能使它大规模地工作。
另请注意,某些地方需要两行,三行,四行甚至五行地址信息来识别位置。英国是这里最严重的罪犯之一,其正式地址将包括各种信息。
您应该做的是设计一个类似“地址”的表格,其中包含以下字段:address1
,address2
,address3
,address4
,address5
,{ {1}},city
,region
,country
。有了它,你可以覆盖他们将扔给你的大多数东西。查看Google地图返回的数据类型。
你的问题似乎暗示某种一对多结构,其中一个地址可能有多个建筑物名称或数字。如果没有某种序列指示器,您将无法知道这些相关记录中的哪一个是第一个。这使事情变得非常复杂。
当担心规范化时,从最简单的工作开始,并解决任何明显的错误。除非你有大量的数据需要处理,否则你通常可以很容易地调整你的模式,如果你没有通过规范化来完成它。