目前,我参与了一个基于仓库的智能交易分析银行系统,其中包括客户流失行为,欺诈检测和CRM分析。我们一直在使用Oracle
作为数据库&它完全是一个数据仓库项目,其数据挖掘算法用于分析。
我们有大约1000名银行客户的记录。对于建模,使用星型模式或雪花模式或星座模式是否更好?我知道星型和雪花模式的基本区别 - 维度表的规范化发生在雪花(a.k.a。雪花)模式中,这对于在大型数据库的情况下加入可能是有问题的。
那么,哪种架构对我的情况更好?来自参与数据仓库的有经验的程序员的答案非常受欢迎!
提前致谢!
答案 0 :(得分:3)
简而言之,我进入这样一个项目的假设是星型模式是合适的。我可以修改一下如果某个维度变得太大而无法有效地完全扫描和,那么通过雪花可以有效地提高查询效率,除非该维度加入到分区键上的事实表(由于在放置在雪花维度上的谓词上应用分区修剪的困难)。