我最近对数据挖掘和机器学习领域产生了兴趣。通过大型数据集并尝试关联隐藏模式和趋势的想法非常吸引人。到目前为止,我已经完成了以下工作
阻碍我的是,当我试图超越分类/关联并进入先验/先验算法时,我被困住了,因为理解数学方程和逻辑不是(谦虚地说)我的一个优点。
所以我的问题是数据挖掘领域(产品所有者或建造者的角色)中是否有人不是天生的数学家?如果是这样的话,你会如何处理未来的领域,因为像Weka和Rapid-miner这样的免费工具都需要一些数学/统计背景?
P.S:对不起,如果我在查询中犯了一些错误,比如将数据挖掘和分析混合在一起,因为我仍然不知所措。我希望我的核心问题很明确。
答案 0 :(得分:2)
那么,能够对数据挖掘模型显示的内容进行一些分析绝对至关重要。然而,现在所有的数学和统计数据都由数据挖掘模型处理。你不需要理解它们背后的数学(虽然它有帮助)。
例如,您可以查看SQL Server Analysis Services Data Mining Algorithms,看看即使是技术参考也是如何使用这些实现,而不是如何重新创建它们。
如果您能够理解业务案例,并且您可以理解数据挖掘告诉您的内容,那么就没有必要深入研究它背后的数学。
至于一些免费工具,我从未使用它们,所以我不能和他们说话。但是,我是SSAS和那些不需要广泛数学背景的数据挖掘模型的忠实粉丝。
答案 1 :(得分:1)
正如Eric所说,并且只要你打算使用现有的算法和API并从中理解它们,我就不会看到所需的数学/统计技能集的问题(无论如何,你需要一些以前的基础知识/水平)。
现在,如果您打算进行研究,或者想要改进或修改现有算法,或者为什么不这样做,那么创建自己的算法,那么数学和统计学就是必须的。我刚刚开始在这个领域做一些研究,我还在努力填补我的技能差距=)