使用R的关联规则挖掘

时间:2015-03-25 11:24:56

标签: r data-mining

我正在尝试查找包含化妆品名称作为列的文件的关联规则,并且一行中的每个事务对于列中的特定产品包含0或1。数据集中有15列。我尝试将数据读入data.frame并在arules库中运行apriori算法。但是,规则输出包括其中包含零的列的组合。例如,见下文

inspect(rules.sorted[1:20])
   lhs                    rhs             support confidence     lift
1  {Brushes=1}         => {Nail.Polish=1}   0.149  1.0000000 3.571429
2  {Brushes=1,                                                       
    Lipstick=0}        => {Nail.Polish=1}   0.100  1.0000000 3.571429
3  {Bag=0,                                                           
    Brushes=1}         => {Nail.Polish=1}   0.129  1.0000000 3.571429
4  {Brushes=1,                                                       
    Eyebrow.Pencils=0} => {Nail.Polish=1}   0.138  1.0000000 3.571429

如果你看一下上面的输出,所有4个规则是相同的,但由于某种原因,算法正在挑选其值为' 0'的其他产品的组合。我该如何避免?

0 个答案:

没有答案