关联规则挖掘

时间:2015-02-27 07:01:54

标签: data-mining

我有一个主要是整数值的数据集。我想对它应用关联规则挖掘。我已经看过像Apriori等流行的算法,但是它们都处理具有布尔值的数据,即,项目存在于事务中或者不存在。

是否有一种算法可以让我们考虑除了计数之外的属性值? (我计划将数据规范化为0到1之间的值)

3 个答案:

答案 0 :(得分:1)

你可以" hack"如果您的nubers是整数(为什么规范化为0 1?)而且小:

,则会出现此限制
apple banana apple

变为

apple banana apple_2

允许查找关联规则,如

banana => apple, apple_2

但是你需要混合使用一些聪明的过滤器来获得无用的规则,比如

apple_2 => apple

答案 1 :(得分:1)

项目项协同过滤非常类似于基于相似性的数据挖掘技术,如关联规则挖掘。此外,协作过滤用于处理连续和有序值,例如星级或李克特量表:这通常是来自用户的偏好信息。

基于内容的过滤可能是您描述的情况的最佳选择。它允许项目属性和权重(不会因该项目的每个用户而更改),然后为每个项目接受用户首选项(这会改变该项目的每个用户)。

如果您希望为每个用户 - 项目对更改首选项(计数)和属性,我不知道处理它的算法。通常算法是针对每个用户 - 项目对的一个输入构建的。

答案 2 :(得分:0)

是。项集挖掘问题有一些变体可以让您指定其他信息。例如,高效用项集挖掘算法允许您指定事务中发生的每个项目的数量,以及每个项目的权重。