需要提供哪种类型的架构,设计和软件才能提供类似于Google Analytics提供的出色自定义报告功能的内容。更具体地说,我们希望用户能够从列表中指定维度和指标并生成报告。
是否有其他人(公司,开发人员)在谷歌级别甚至完成了这项功能?实施例
注意
我对建立谷歌分析竞争对手并不感兴趣。我希望将报告的简易性应用到我们自己独特的数据集中。
由于
答案 0 :(得分:1)
您肯定需要一个数据仓库,其中有许多ETL,agg和pre-agg进程在非高峰时段运行。 OLAP多维数据集无法真正扩展到高容量Web分析。
对于数据收集,您可能还希望使用MSMQ或类似的硬件负载平衡。磁盘I / O是一个典型的瓶颈,因此在内存中工作并进行一些预聚合肯定有帮助。在我以前的Microsoft工作中,我们的一些遗留数据收集系统直接记录到日志文件而不是数据库。我们使用log parser)并且几乎全天候进行了大量的ETL和聚合。
数据收集是其核心,如果您打算扩展,您将不得不构建最先进的数据仓库。我们几乎完全依赖存储过程。我们有成千上万的,一些令人生畏的复杂和大量优化。除了性能之外,可扩展性也是一个大问题。
答案 1 :(得分:0)
您可能想查看http://haveamint.com/。它不是免费的,但作为一种产品,它可以让您托管自己的分析。
Piwik(http://piwik.org/)是一个很好的开源实现。
就构建谷歌分析竞争对手而言,分析并不是困难的部分。如果您的服务会着火,那么最大的困难就是扩展到数据库。