使用Weka处理关联规则的缺失值

时间:2014-06-02 22:10:21

标签: data-mining weka apriori

我是Weka的新手并且遇到了问题。我有一个包含大约13个特征(全二进制)的数据集。某些功能仅适用于少量数据。当我使用Weka运行关联规则挖掘时,它基于特征值为0来识别属性之间的强相关关系(0表示该特征不适用)。

我希望只为正面特征确定相关关系。我该怎么做?

1 个答案:

答案 0 :(得分:2)

这应该是默认行为,恕我直言。

在典型的APRIORI用例中,大多数交易都缺少大多数项目。

也许将您的商品转换为非数字类型,并为缺失值替换0? 经典示例使用以下格式:

@relation supermarket
@attribute 'department1' { t}
...
@data
?,?,...,t,...

?表示缺失,t表示存在。