在follow-up to this answer中,我想问一下你们是否知道任何好的(更重要的是易于理解的)教程和/或{{3}的数据挖掘示例}。
自从我第一次听说它以及它可以做的事情以来,我一直对数据挖掘很感兴趣,我也有一些实验,我想对我的一些数据进行实验,而且我已经已经买了四本书,我特别感兴趣的是以下两本:
Weka toolkit Intelligent Data Analysis http://ecx.images-amazon.com/images/I/41CJNXchMrL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg
最后一篇是Weka的同一作者写的,包含了很多例子,但我发现它有点难以理解逻辑,特别是数学。我的数学技能目前非常粗糙,我打算今年去大学,希望我能学习并能够更好地理解所涉及的数学,但在那之前我想在数据挖掘中获得一些实践。
是否有任何一步一步的教程,包含我可以阅读的示例数据,以便开始使用Weka工具包?
答案 0 :(得分:17)
对于“应用”数据挖掘,对于初学者来说,你可能根本不需要考虑数学。 Weka是大学机器学习项目的产物, offers 100+ algorithms 。与微软 SQL server SSAS which offers nine 算法形成对比 - 他们甚至懒得解释数学。
它们都提供关联,聚类,属性选择,某种神经网络。 所以,诀窍是要了解你想要实现的目标,而不一定是下面的数学。尝试阅读有关Microsoft算法(良好文档)的信息,看看您是否能够找出SSAS和Weka的共同原则 - 这可以帮助您专注于基本原则并帮助您入门。
列出了一些Weka tutorials here 。
答案 1 :(得分:5)
就个人而言,我会使用RapidMiner5,因为它是一个非常简单的GUI环境(比v4好得多)。它具有所有可用的WEKA功能。
在这里获取快速通道:http://www.rapid-i.com
RapidMiner的超级简单介绍视频:
https://dspace.ndlr.ie/jspui/handle/10633/2353
这里:
http://www.neuralmarkettrends.com/
在这里:
http://www.youtube.com/user/VancouverData
如果您想了解有关数据挖掘背后统计数据的更多信息,请参阅Google的Standford教授讲座系列:
答案 2 :(得分:0)