我使用大型数据集市(存储的数据超过2 TB)。
我们每天运行1000多个SSIS软件包。他们将数据从100多个不同的数据源提取到我们的数据集市中。然后将这些数据汇总并添加到我们的事实表中。
我们不使用主键/外键SQL模式。如果过程缓慢,我们将在连接的字段或where子句上添加索引。但是,请勿使用内置的主键/外键。
我们不会在很大程度上“标准化”我们的数据-因此到处都有数据重复-我们可以通过这种方式减少脂肪。但是,这将使分析师难以快速获得所需的数据,并增加了开发新程序的时间。
这似乎对我们来说很好。
我想知道是否有任何真正有经验的SQL开发人员/ DBA可以对此发表评论,并在您不向其他用户提供数据并正在加载的情况下提供有关使用主外键的一些智慧。每天都有大量数据。