Saiku,Mondrian性能随着大量数据而降低

时间:2014-02-25 11:32:03

标签: olap mondrian saiku

我们正在使用mondrian olap架构与saiku来分析我们的记录。我们正在使用星型模式模型。我们有一个事实表,其中包含大约3000000条记录。我们有四个维度表时间戳,排名,路径和域。每个条目的时间戳几乎是唯一的。现在,在我们执行分析时在saiku中部署架构后,saiku需要花费大量时间来返回结果。获取3000条记录需要10分钟,如果记录的数量超过50000只saiku就死了。请告诉我如何提高saiku和mondrian的性能。

2 个答案:

答案 0 :(得分:3)

您可以轻松判断这是数据库问题还是saiku / mondrian问题:

  1. saiku-server/tomcat/webapps/saiku/WEB-INF/classes/log4j.xml中启用sql日志工具(取消注释Special Log File specifically for Mondrian SQL Statements文本
  2. 部分
  3. 重新启动服务器
  4. 在Saiku做几个典型的分析
  5. 从日志中获取二手查询
  6. 直接在数据库中分析查询的性能(例如,对于PostgreSQL,有explain analyze命令)
  7. 如果查询的性能与Saiku一样慢,那么您就已经确定了问题。

    顺便说一下。如果你真的有时间戳的维度(按秒?),你应该考虑将它分成两个维度,包括天和秒。

答案 1 :(得分:0)

很难理解你的具体问题是什么。

当我们遇到saiku性能问题时,有两件事帮助了我们:

  • 所有字段的索引,有时可能是它们的组合 用作维度 - 有助于像DB

  • 中的任何地方一样
  • 我们避免了与其他表格联合使用我们的数据