如何将数据挖掘(关联规则)应用于庞大的数据库?

时间:2010-03-24 14:30:53

标签: sql-server sql-server-2000 data-mining associations

我想要做的是在我的SQL Server 2000数据库上应用数据挖掘的关联方法。关联规则类似于“查找在数据库中一起出现的最常见项目。”

对于那些不知道或想要记住关联方法是什么的人,请看一下有关数据挖掘中关联规则的演示文稿。

http://www.authorstream.com/Presentation/sushiltry-108428-association-rules-data-mining-science-technology-ppt-powerpoint/

第17张幻灯片提供了一个在数据库上应用关联规则的好例子。

那么你能帮我解决一下我应该如何编写我的SQL代码(当然这样就足够了)

感谢。

编辑:我更正了链接。

3 个答案:

答案 0 :(得分:2)

您需要使用MS SQL Server的Analysis Services。 Analysis Services具有Microsoft关联算法,该算法是关联规则挖掘算法。您需要提供数据集,支持和置信度值,其余的将由您负责 分析服务。如果数据集非常大,您可以考虑设置模式大小。

http://technet.microsoft.com/en-us/library/ms174916.aspx http://technet.microsoft.com/en-us/library/ms167047.aspx

或者,您可以使用自己的关联规则挖掘算法实现(Apriori,FP-Growth,Eclat等)

答案 1 :(得分:1)

您需要实施apriori algorithm。检查link-1link-2

答案 2 :(得分:0)

如果您想要Apriori,FPGrowth,Eclat等的一些Java实现,您可以查看我的网站:http://www.philippe-fournier-viger.com/spmf/

但它不提供SQL插件,因此要使用此代码,您需要先以适当的格式导出数据库。

我认为可能有一些专门用于SQL数据库中的模式挖掘的工具。通过搜索你可以找到一些。