我正在计划组织数据仓库的早期阶段。 当从多个来源创建尺寸时,我不确定如何最好地处理它。
例如 员工存储在HR系统中。它是人员和相关属性的列表。
还有一个存储志愿者的系统,该系统是具有一些相似属性的人的列表,并且此系统具有一些独特之处。
将会有其他系统包含它们自己的“人员”集,但还没有在范围内。
有关此情况的一些问题:
考虑到我正在沿着星型/雪花模式路线行驶,单身人士是答案吗?
当处理一个数据源中的属性而不是另一个数据源中的属性时,应将它们放在第二维表中,还是应将所有属性附加到此人,即使在某些情况下它们为空?
这种类型的数据建模问题是否有标准的流程/设计模式?