apriori外观rhs有多种产品

时间:2019-04-10 20:16:41

标签: r arules

    我正在使用R apriori(库(规则))来获取规则。希望所有具有与产品列表相关的rhs(右侧)的规则(不仅仅是一个)

我也在“产品”中添加了客户的服务信息和产品名称 然后使用产品创建横切和规则 那么我希望有一个规则,即rhs只包含product_name,但是我可以在lhs中出现segemtation。

希望有建议,无法使用apriori(,appearence =(list(rhs = ...)))函数实现

和好的奇怪结果在问题2中描述如下。

  1. 找出我是否给列表更长的时间,例如c(“全脂牛奶”,“谷物”,“其他蔬菜”,“大米”,“特色奶酪”,“果酱”) 规则(3042)比仅具有c(“全脂牛奶”,“谷物”,“其他蔬菜”)(3077)少,因此不确定为什么以及如何理解外观=(list(rhs = ...))函数< / li>

我最初的问题不是容易创建可重新创建的代码(直接从数据库读取数据),但是这里有一些说明;

具有每个客户每个横断面的数据集(购物篮/产品名称): cust1苹果梨片 cust2牛奶苹果酒 ....

每个客户还具有一个细分(配置文件)标签 cust1 20-30家族金 cust2 30-40男性 ...

然后我将细分和配置文件放在一起  20-30粒黄金苹果梨片  30-40男siver牛奶苹果赢 ...

然后使用此数据转换为“横切”以实现arule apporiori函数并获得一些规则

例如{20-30,家族,苹果} => {葡萄酒}      {male,wine} => {30-40}

但是我只对具有产品名称(梨,薯条,苹果但不是30-40,男性,黄金)的rhs规则感兴趣

所以我尝试使用apriori(,appearence =(list(rhs = product_items)))函数来获取 我创建了一个名为product_items <-data [tag=='product_name']

的字符列表。

我怎么找到0条规则。我试了一段时间,然后发现奇怪的是,如果我只使用 product_item[1:10]我有30000条规则,如果增加到 product_item[1:80]的规则数量减少到200 ...

我们可以使用data(Groceries)为例

pro <-c("whole milk", "cereals","other vegetables", "rice", "specialty cheese", "jam")
lp<- c("whole milk", "cereals","other vegetables")

r2<- apriori (Groceries, 
                  parameter = list(supp = 0.001, conf = 0.5),
                  appearance = list(rhs = pro)
                  ) 

r1 <- apriori (Groceries, 
                  parameter = list(supp = 0.001, conf = 0.5),
                  appearance = list(rhs = lp)
                  ) 

于是,summary(r2)有3042条规则,而summary(r1) bwe有3077条规则 所以这使我质疑我对apriori(,appearence =(list(rhs = ....)))函数的理解。我以为如果创建一个字符列表或矢量product_name会有更多的产品,这意味着我有更多的规则。因为这意味着我将有任何符合我在函数中放入的product_name的规则(rhs)。 但是int product_name项的增加减少了规则的数量,这让我质疑我的理解。 有了您的解释

我仍然需要找出所有与rhs相关的规则,它们可以是product_name中的任何一个,也可以是product_name中的任何项目,关于如何关联它的任何建议?

说我希望所有规则都适合我对supp,conf的要求,并且在rhs中还包含以下成分的“全脂牛奶”,“谷物”,“其他蔬菜”,“大米”,“特色奶酪”,“果酱“)

我该怎么做? 谢谢!

0 个答案:

没有答案