我正在使用r arules 包来生成围绕事务数据集的规则。在数据集中,我有超过500个交易项目,如苹果,啤酒等。
我知道如何生成规则并根据支持或信心对它们进行排序,但如果我只想查看涉及某些项目的规则,我该怎么办呢?就像我只想要有苹果的规则一样。
类似的东西:
inspect(rules[keyword='apple'])
答案 0 :(得分:1)
您可以使用subset
执行此操作。
inspect(subset(rules, subset = items %in% "apple"))
由于您未提供数据,我将使用arules
包中提供的数据提供完整示例。
library(arules)
data(Groceries)
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.8))
现在挑选出提及酸奶的规则。有太多不能显示完整的结果,所以我只显示前三个。
inspect(subset(rules, subset = items %in% "yogurt")[1:3])
lhs rhs support confidence lift count
[1] {yogurt,
cereals} => {whole milk} 0.001728521 0.8095238 3.168192 17
[2] {yogurt,
rice} => {other vegetables} 0.001931876 0.8260870 4.269346 19
[3] {other vegetables,
yogurt,
specialty cheese} => {whole milk} 0.001321810 0.8125000 3.179840 13
这些都没有在rhs上涂酸奶,所以我也显示规则20表明它也在那里捕捉酸奶。
inspect(subset(rules, subset = items %in% "yogurt")[20])
lhs rhs support confidence
[1] {other vegetables,butter milk,pastry} => {yogurt} 0.001220132 0.8
lift count
[1] 5.734694 12