我即将开始为电子商务网站开发网络分析工具。
我要记录几个不同的事件,基本上点击页面的各种元素和页面视图。
这些事件包含元数据(登录用户的用户名,国家/地区,年龄等),页面本身带有其他元数据(类别,子类别,产品等)。
我的公司希望像OLAP多维数据集一样,能够回答以下问题:
x国家/地区有多少客户访问了类别y? 2012年1月x类别的浏览量是多少? 来自国家x的客户有多少访问了类别y?
我的理解是我应该使用OLAP引擎来记录这些事件,然后构建一个报告界面以允许我的同事使用它。
我是对的吗?您对我应该使用的引擎和前端/报告工具有什么建议吗?我是一名Python程序员,所以任何对Python友好的东西都会很好。
谢谢!
答案 0 :(得分:2)
主要问题是您的多维数据集的大小,以及是否需要开源OLAP解决方案。
如果您正在处理大型多维数据集并希望为将来的功能腾出空间,那么您可以选择真正的OLAP Server。其中一些是开源的 - Mondrian - 而另一些则是'有限的'社区版 - Palo,icCube。这里重要的是与MDX和XMLA兼容。 defacto OLAP标准,因此您可以插入不同的报告工具和/或使用现有的库。我的理解是,没有像Java或.NET那样的XMLA库的Phyton版本,不确定这是否可行。
如果您的立方体很小,您可以自己开发一些东西,或者根据Charlax的评论指示其他更快的解决方案。
答案 1 :(得分:2)
如所选答案中所述,这取决于您的数据量。但是,只要您遇到轻量级Python OLAP框架就足够的情况,那么您可以尝试Cubes,来源位于github。它包含SQL后端(也可以实现任何其他后端)并提供轻型HTTP OLAP server。可以找到使用它的应用程序(带有HTTP Slicer OLAP服务器后端的PHP前端)的示例here它不包含可视化层和复杂查询,但这是小的权衡。