我知道星型模式和雪花模式之间的基本区别 - 雪花模式将维度表分解为多个表以便对它们进行规范化,星型模式只有一个“级别”的维度表。但是Snowflake Schema的Wikipedia article说
“有些用户可能希望向数据库提交查询,使用传统的多维报告工具,无法在简单的星型模式中表达。这在客户数据库的数据挖掘中尤为常见,其中常见的要求是找到常见的购买满足复杂标准的产品的客户之间的因素。通常需要一些雪花来允许简单的查询工具形成这样的查询,特别是如果在首次设计数据仓库时没有预料到这些形式的查询。“
何时无法在星型模式中编写查询,而该模式可以在雪花模式中为相同的基础数据编写?似乎星型模式总是允许相同的查询。
答案 0 :(得分:6)
对于数据挖掘,您几乎总是需要准备数据 - 主要是作为一个“平面表”。
可能是查询,准备好的视图或CSV导出 - 取决于工具和您的偏好。
现在,为了正确理解这篇文章,人们可能不得不在写作时吸烟与作者一样。
答案 1 :(得分:0)
正如您所提到的,从关系数据库开始为数据挖掘准备一个平面表并不是一项简单的任务,雪花或星型模式只能用于某一点。
但是,有一个名为Dataconda的软件会自动从DB创建一个平面表。
基本上,您在关系数据库中选择目标表,而dataconda"扩展"它通过添加数千个新属性;这些属性是通过执行涉及多个表的复杂查询获得的。