分析mysql数据

时间:2011-06-06 16:47:04

标签: mysql statistics analytics data-mining

我对数据分析一直很陌生,并且想知道是否有人有任何关于如何开始的建议?

这是我想要解决的问题。我有一个mysql数据库,每天从20行增加到每天超过几百万行(取决于数据源),我想分析它的关系。基本上它是数据组合的可能性(红色= 2,蓝色= 5,黑色= 5等)我想要一个工具来逐日分析它以查看哪些是最有可能的(即如果我只给出5%的约束)总值可以改变或只能选择5种颜色)。

我认为这将是复杂的,但我是新人,完全愿意学习。对于上述问题(以及相关类型的分析问题),您建议我做什么?我正在寻找一个工具(开源请...我是一个贫穷的学生),建议书,howto doc等。我想要一个良好的基础,这不是生产(这是我设置的学习环境)所以我可以试验一下。

我正在学习python和java,并且正在考虑使用这些工具进行分析,但朋友建议可能会使用专为此设计的工具,或者遵循经过尝试/测试过的方法。

1 个答案:

答案 0 :(得分:1)

你对实际细节很了解。但是,如果您正在寻找开源统计分析软件包,我建议您从rwekaknime开始。当然,这是一个非常重要的主题。

根据您的理解程度,使用SQL也可以做很多事情,但不知道您的数据结构,它代表什么以及您想要完成什么,没有任何用处试图解释你能做什么。

对于你提到的学习Python和Java,这也是有益的。两者都有几个开源统计软件包可用和/或可以绑定到我上面列出的程序。