我对数据分析一直很陌生,并且想知道是否有人有任何关于如何开始的建议?
这是我想要解决的问题。我有一个mysql数据库,每天从20行增加到每天超过几百万行(取决于数据源),我想分析它的关系。基本上它是数据组合的可能性(红色= 2,蓝色= 5,黑色= 5等)我想要一个工具来逐日分析它以查看哪些是最有可能的(即如果我只给出5%的约束)总值可以改变或只能选择5种颜色)。
我认为这将是复杂的,但我是新人,完全愿意学习。对于上述问题(以及相关类型的分析问题),您建议我做什么?我正在寻找一个工具(开源请...我是一个贫穷的学生),建议书,howto doc等。我想要一个良好的基础,这不是生产(这是我设置的学习环境)所以我可以试验一下。
我正在学习python和java,并且正在考虑使用这些工具进行分析,但朋友建议可能会使用专为此设计的工具,或者遵循经过尝试/测试过的方法。