我也在“产品”中添加了客户的服务信息和产品名称 然后使用产品创建横切和规则 那么我希望有一个规则,即rhs只包含product_name,但是我可以在lhs中出现segemtation。
希望有建议,无法使用apriori(,appearence =(list(rhs = ...)))函数实现
和好的奇怪结果在问题2中描述如下。
我最初的问题不是容易创建可重新创建的代码(直接从数据库读取数据),但是这里有一些说明;
具有每个客户每个横断面的数据集(购物篮/产品名称): cust1苹果梨片 cust2牛奶苹果酒 ....
每个客户还具有一个细分(配置文件)标签 cust1 20-30家族金 cust2 30-40男性 ...
然后我将细分和配置文件放在一起 20-30粒黄金苹果梨片 30-40男siver牛奶苹果赢 ...
然后使用此数据转换为“横切”以实现arule apporiori函数并获得一些规则
例如{20-30,家族,苹果} => {葡萄酒} {male,wine} => {30-40}
但是我只对具有产品名称(梨,薯条,苹果但不是30-40,男性,黄金)的rhs规则感兴趣
所以我尝试使用apriori(,appearence =(list(rhs = product_items)))函数来获取
我创建了一个名为product_items <-data [tag=='product_name']
我怎么找到0条规则。我试了一段时间,然后发现奇怪的是,如果我只使用
product_item[1:10]
我有30000条规则,如果增加到
product_item[1:80]
的规则数量减少到200 ...
我们可以使用data(Groceries)
为例
pro <-c("whole milk", "cereals","other vegetables", "rice", "specialty cheese", "jam")
lp<- c("whole milk", "cereals","other vegetables")
r2<- apriori (Groceries,
parameter = list(supp = 0.001, conf = 0.5),
appearance = list(rhs = pro)
)
r1 <- apriori (Groceries,
parameter = list(supp = 0.001, conf = 0.5),
appearance = list(rhs = lp)
)
于是,summary(r2)
有3042条规则,而summary(r1)
bwe有3077条规则
所以这使我质疑我对apriori(,appearence =(list(rhs = ....)))函数的理解。我以为如果创建一个字符列表或矢量product_name会有更多的产品,这意味着我有更多的规则。因为这意味着我将有任何符合我在函数中放入的product_name的规则(rhs)。
但是int product_name项的增加减少了规则的数量,这让我质疑我的理解。
有了您的解释
我仍然需要找出所有与rhs相关的规则,它们可以是product_name中的任何一个,也可以是product_name中的任何项目,关于如何关联它的任何建议?
说我希望所有规则都适合我对supp,conf的要求,并且在rhs中还包含以下成分的“全脂牛奶”,“谷物”,“其他蔬菜”,“大米”,“特色奶酪”,“果酱“)
我该怎么做? 谢谢!