如何构建和实施自助式自定义报告?

时间:2009-05-20 17:15:42

标签: database-design architecture reporting

需要提供哪种类型的架构,设计和软件才能提供类似于Google Analytics提供的出色自定义报告功能的内容。更具体地说,我们希望用户能够从列表中指定维度和指标并生成报告。

  • 我们需要数据仓库吗?
  • 我们需要OLAP吗?
  • 数据是否可以访问 图层需要ORM,动态sql或 存储过程?
  • 有没有第三名 派对或开源产品可以 让我们分道扬??

是否有其他人(公司,开发人员)在谷歌级别甚至完成了这项功能?实施例

注意

我对建立谷歌分析竞争对手并不感兴趣。我希望将报告的简易性应用到我们自己独特的数据集中。

由于

2 个答案:

答案 0 :(得分:1)

您肯定需要一个数据仓库,其中有许多ETL,agg和pre-agg进程在非高峰时段运行。 OLAP多维数据集无法真正扩展到高容量Web分析。

对于数据收集,您可能还希望使用MSMQ或类似的硬件负载平衡。磁盘I / O是一个典型的瓶颈,因此在内存中工作并进行一些预聚合肯定有帮助。在我以前的Microsoft工作中,我们的一些遗留数据收集系统直接记录到日志文件而不是数据库。我们使用log parser)并且几乎全天候进行了大量的ETL和聚合。

数据收集是其核心,如果您打算扩展,您将不得不构建最先进的数据仓库。我们几乎完全依赖存储过程。我们有成千上万的,一些令人生畏的复杂和大量优化。除了性能之外,可扩展性也是一个大问题。

答案 1 :(得分:0)

您可能想查看http://haveamint.com/。它不是免费的,但作为一种产品,它可以让您托管自己的分析。

Piwik(http://piwik.org/)是一个很好的开源实现。

就构建谷歌分析竞争对手而言,分析并不是困难的部分。如果您的服务会着火,那么最大的困难就是扩展到数据库。