我的学习数据挖掘的路径是否正确

时间:2010-09-13 06:01:38

标签: sql data-mining business-intelligence

有人告诉我的老板,数据挖掘可以对推荐,预测建模等公司做些什么。基本上我们是一家网站公司。我要休假6个月。 所以我的老板说我可以学习一些DM技术,这样当我回来时,我们可以访问小商店或小公司,使用数据挖掘算法为他们提供预测数据。

商店将只为客户提供sql文件或csv文件。

现在我只知道MYSQL并且不知道什么是数据挖掘以及它是否像我上面所说的那样工作,我的意思是,如果有人拥有客户数据库,购物并且我可以应用数据挖掘技术,那么这是可能的。我的意思是

(raw mysql or sql data) or (csv files) ----data mining--> (some useful result)
  • 1)上述系统是正确还是我错了
  • 2)商店或企业是否希望拥有该产品或我遗失了什么

我的学习计划遵循以下顺序。我想首先得到一些sql server 2008证书,因为在我的区域大多数都使用微软,所以可能我需要知道sql

1)MCTS: SQL Server 2008, Implementation and Maintenance
2)MCTS: SQL Server 2008, Database Development
3)MCTS: SQL Server 2008, Business Intelligence Development and Maintenance

(或者我应该去oracle和oracle数据仓库......我想首先正确地做一些数据库)

4)Data Mining with Microsoft SQL Server 2008 (2009)     
5)Python for dummies    
6)Programming Collective Intelligence: Building Smart Web 2.0 Applications

我的流量是否正确,或者我能以更好的方式实现我的结果。 我做证书的原因是为了对sql有所了解,如果我在6个月后没有得到那份工作,我可以进入与数据挖掘或BI或至少sql server相关的新工作。

请帮帮我

4 个答案:

答案 0 :(得分:0)

好的,这不是一个简单的是/否答案。 你正在做一些正确的事。这样您就可以了解SQL Server数据挖掘工具集。你将在哪里使用哪个算法。 (Naive Byes如何。与决策树有所不同。等)

一旦你知道这些东西,第二件事就是了解你的数据以及如何制作将作为输入的FLAT表。这是最重要的,因为这是您将用于训练模型的数据。你不需要知道ANN算法背后的内部数学等等。你应该知道如何使用它。有一些数据挖掘加载项可​​以用于excel(2007年以后),您可以使用它们进行游戏。

Rafal Luckawiski在http://channel9.msdn.com上有一些数据挖掘视频。它们有助于对如何开始有所了解。

在此之后,这是一个实践问题,您使用新数据和制作新模型并分析结果的次数越多,您将变得越好。

如果您需要有关PPT,样品等的更多信息,请告诉我

答案 1 :(得分:-1)

呃,要有效地进行数据挖掘,你需要知道很多的数学。你的道路就像“我想成为一名外科医生,所以我将学习如何用手术刀切割”。是的,了解一些SQL并且可能是必要的(仅取决于数据的组织方式),但FAR足够了。

答案 2 :(得分:-1)

好像你做错了。

最重要的是学习数据挖掘,人工智能和预测科学主题,所有那些核心数学和CS的东西。不是数据库技术,虽然很重要,但与数据挖掘领域关系不大。

我会推荐一本书,我认为它是根据您的需求量身定制的:Programming Collective Intelligence

alt text

答案 3 :(得分:-1)

从你所写的内容来看,它接近于数据挖掘而不是数据抓取。

首先,answer by Ngu Soon Hui正在将你转向一个完全错误的方向 他建议你的是data scarping而不是data mining 您最好理解数据挖掘与数据抓取之间的差异(也就是网站/网络抓取,也就是屏幕抓取,也就是数据收集):

  

“(原始mysql或sql数据)或(csv文件)----数据挖掘 - >(一些有用的结果)”

完全忘记MySql并且不要浪费你的时间,因为在MySql中绝对不支持数据挖掘。仅用于数据抓取。虽然你可能对后者感兴趣。你最好知道差异

  

“1)MCTS:SQL Server 2008,   实施和维护2)MCTS:   SQL Server 2008,数据库开发   3)MCTS:SQL Server 2008,Business   情报发展与   维护“

为什么你需要1)和2)? 甚至3)只包含20%的数据挖掘。

  

5)Python for dummies 6)编程   集体智慧:建设   智能Web 2.0应用程序

为什么需要Python?

6)不是数据挖掘。它被称为数据抓取,它再次成为DM的完全错误方向的路径