在设计ROLAP多维数据集时,是否有人拥有可以考虑事项列表的资源,而不是MOLAP(我在Pentaho中这样做,但我想其他实现的原则并不相同)。例如,我想的是:
是否应该在ETL阶段进行额外的转换工作,以减少查询多维数据集时的计算工作?
我的所有维度表应该与我的多维数据集位于同一个数据库中吗?
答案 0 :(得分:1)
我是印度尼西亚的Pentaho实施者。首先,您当然应该尝试通过所涉及的代理键汇总所有度量组。
在Mondrian中,您可以使用其他聚合表“缓存”一些计算。你可以在Pentaho Aggregate Designer中完成。但在此之后,您将需要在数据仓库/ ETL阶段中进行额外的工作。
此致
FERIS
答案 1 :(得分:1)
首先 - 设计类似,但它们是由不同的性能和驱动力驱动的。可扩展性策略。
其次 - etl过程几乎相同。除了 - 由于关系数据库中的可伸缩性功能,您通常会在折叠多维数据集中看到比molap多维数据集更多的数据。而且你经常会在的非翻转数据库(仓库,甚至是交易数据库)中看到一个rolap cube ,它不仅仅支持rolap。
最后,如果您有足够的数据量,通常会生成聚合表。这种聚合可以通过很多不同的方式完成,但我认为它通常不是由您的ETL流程驱动的,除非您无法管理单独的异步流程或数据量使得运行期间摘要作业变得不切实际。
答案 2 :(得分:0)
感谢Feris的链接和输入,但最后我选择了这本书:
我很好地浏览了Mondrian网站+文档,但这本书看起来更全面。