用于数据分析和学习的Python包推荐

时间:2012-09-14 13:29:31

标签: python olap pandas pytables cubes

我想在文章发布平台上构建分析引擎。更具体地说,我想跟踪用户的阅读行为(例如文章的观看次数,文章开放时间,评级等),以及文章本身的统计数据(例如段落数量,作者等) )。

这有两个目的:

  1. 提供有关用户和文章的见解
  2. 向用户提供建议
  3. 对于数据分析部分,我一直在关注cubespandaspytables。有很多数据,它存储在MySQL表中;我不确定哪些软件包可以更好地处理这样的后端。

    对于推荐部分,我只是考虑将数据从数据分析引擎提供给聚类模型。

    有关如何将所有这些放在一起的任何建议,以及可以帮助我的酷炫python项目吗? 如果我应该提供更多信息,请告诉我。

    谢谢

2 个答案:

答案 0 :(得分:3)

Scikit-learn应该让您对数据处理(群集)部分感到满意​​。

答案 1 :(得分:2)

对于分析和可视化方面,如您所述,您有Cubes,而且我使用的是CubesViewer