我们正在考虑从基于Java web的项目的事务数据库报告到离线/报告数据库。一些ETL(如Kettle)将完整/增量更新加载到脱机数据库。
原因显而易见,减少事务数据库和负载的负载报告绩效。
我们的突出问题与设计离线数据库有关,因为我对OLAP知之甚少。要求是让某些报告引擎(如Jasper / Pentaho)运行报告,开发分析和仪表板。
设计离线/报告的最佳方式是什么
1)一张大平台? - 我确信这个想法非常糟糕。2)多个平台。我的意思是多个非规范化表。想法是对相关表进行去规范化并链接其他去规范化表以获得详细报告。
还有什么想法我们如何处理摘要?
3)星型模式,事实和维度。
这里有一个愚蠢的问题:我们是否可以在事实表中包含所有其他详细信息列以及附加度量(摘要或汇总数据)
是否有一个工具可以从一组规范化表中对数据进行反规范化?
提前致谢。 普拉迪普