标签: python olap pandas pytables cubes
我想在文章发布平台上构建分析引擎。更具体地说,我想跟踪用户的阅读行为(例如文章的观看次数,文章开放时间,评级等),以及文章本身的统计数据(例如段落数量,作者等) )。
这有两个目的:
对于数据分析部分,我一直在关注cubes,pandas和pytables。有很多数据,它存储在MySQL表中;我不确定哪些软件包可以更好地处理这样的后端。
对于推荐部分,我只是考虑将数据从数据分析引擎提供给聚类模型。
有关如何将所有这些放在一起的任何建议,以及可以帮助我的酷炫python项目吗? 如果我应该提供更多信息,请告诉我。
谢谢
答案 0 :(得分:3)
Scikit-learn应该让您对数据处理(群集)部分感到满意。
答案 1 :(得分:2)
对于分析和可视化方面,如您所述,您有Cubes,而且我使用的是CubesViewer。