数据挖掘/ BI /分析/ ML:数学挑战的人可以进入这个领域吗?

时间:2009-08-26 12:05:43

标签: data-mining

我最近对数据挖掘和机器学习领域产生了兴趣。通过大型数据集并尝试关联隐藏模式和趋势的想法非常吸引人。到目前为止,我已经完成了以下工作

  • 使用Weka加载简单数据集并生成决策树
  • 继续阅读相同的书籍,维基,博客和SO
  • 开始玩SQL Server DM和Python API
  • 了解网上免费提供数据集的选项(freedb,UN等)

阻碍我的是,当我试图超越分类/关联并进入先验/先验算法时,我被困住了,因为理解数学方程和逻辑不是(谦虚地说)我的一个优点。

所以我的问题是数据挖掘领域(产品所有者或建造者的角色)中是否有人不是天生的数学家?如果是这样的话,你会如何处理未来的领域,因为像Weka和Rapid-miner这样的免费工具都需要一些数学/统计背景?

P.S:对不起,如果我在查询中犯了一些错误,比如将数据挖掘和分析混合在一起,因为我仍然不知所措。我希望我的核心问题很明确。

2 个答案:

答案 0 :(得分:2)

那么,能够对数据挖掘模型显示的内容进行一些分析绝对至关重要。然而,现在所有的数学和统计数据都由数据挖掘模型处理。你不需要理解它们背后的数学(虽然它有帮助)。

例如,您可以查看SQL Server Analysis Services Data Mining Algorithms,看看即使是技术参考也是如何使用这些实现,而不是如何重新创建它们。

如果您能够理解业务案例,并且您可以理解数据挖掘告诉您的内容,那么就没有必要深入研究它背后的数学。

至于一些免费工具,我从未使用它们,所以我不能和他们说话。但是,我是SSAS和那些不需要广泛数学背景的数据挖掘模型的忠实粉丝。

答案 1 :(得分:1)

正如Eric所说,并且只要你打算使用现有的算法和API并从中理解它们,我就不会看到所需的数学/统计技能集的问题(无论如何,你需要一些以前的基础知识/水平)。

现在,如果您打算进行研究,或者想要改进或修改现有算法,或者为什么不这样做,那么创建自己的算法,那么数学和统计学就是必须的。我刚刚开始在这个领域做一些研究,我还在努力填补我的技能差距=)