地址维度与否?

时间:2015-12-14 20:09:55

标签: data-warehouse dimensional-modeling

我的团队正在内部辩论我们是否应该创建一个单独的地址信息维度。用例是邮件营销机构的仓库,因此,由于多种原因,地址非常重要。

我们有几条地址信息流入(如银行地址,客户地址(我们客户的客户),邮件列表地址(或清单)和客户地址。我们也可能获得位信息以及我们可能需要根据地址比较与特定客户联系的其他信息。

我们还对地址进行地理编码,以增强,标准化和验证我们的地址。

总的来说,我们为任何给定的地址存储以下字段:

DeliveryLine1 
DeliveryLine2 
LastLine 
DeliveryPointBarcode 
StreetNumber 
ApartmentNumber 
ApartmentUnitType 
StreetName 
StreetSuffix 
Locality 
Region 
ZipCode 
ZipCodePlusFour 
DeliveryPoint 
DeliveryPointCheckpointDigit 
Latitude 
Longitude 
RecordType 
ZipType 
CountyFIPS 
CarrierRoute 
ResidentialDeliveryIndicator 
Precision 
DPV 
Vacant 
Active 
EWS 
总共有27个字段。

我的同事认为,地址应该进入每个方面(客户,银行,客户,清单)。虽然我同意在我们存储Address1,Address2,City,State,Zip的简单情况下它是有意义的,但我们存储了大量有关地址的附加信息,稍后会添加更多的位和(可能)。我认为这样的事情更适合作为一个单独的维度。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

从维度建模的角度来看,你的事实表应该回答这个问题。如果您的[邮件营销]事实与地址相关,那么请继续将地址作为单独的维度。我的意思是,如果您对银行,客户,邮件列表地址和客户进行[邮件营销],并希望根据地理信息(即地址)分析信息,则应将其创建为单独的维度。但是,如果您[通常]只向您的客户邮寄市场并将地址用于其他目的,即找到近乎客户,银行等,那么我认为将地址作为维度并没有多大价值。实质上,如果您的事实与地址(银行,客户,邮件列表地址,客户)处于同一级别的地址相关,那么它应该是一个维度。如果这仅仅意味着银行,客户,邮件列表地址或客户的属性,则无需使用维度。