R:关联规则(arules)不写任何规则 - 我的数据集太小了吗?

时间:2018-02-01 23:13:55

标签: r statistics rstudio arules market-basket-analysis

我已经在线阅读了Stack和各种文档,但我仍然无法使用它。

我有5,368笔交易的数据集。它们作为带有大量不同列的Excel工作表进入 - CustomerID,ItemID和OrderID(见下文,数据来自A1:C10)。

我有3个问题:

  • 具体来说,数据需要采用何种格式?我尝试使用下面显示的所有3种格式阅读它。我可以通过read.transactions读取任何这些格式的数据,但是当我去运行apriori它只给我一条规则(或者有时没有)。即使要获得这一条规则,我也必须将信心设置为.01,并且lhs始终为空白。

  • 我最近的尝试,我使用了第21行显示的格式。我甚至删除了所有单笔交易(第23行和第24行)。然后我运行了这个语法:

sb<-read.transactions(file = "~/Downloads/sbasket.csv",sep = ",")

我想我甚至尝试过:

sb<-read.transactions(file = "~/Downloads/sbasket.csv", format="single",sep=",", cols=c(1,2))
  • 您的数据集需要多大?我的数据集是5,368行,其中只有366行涉及多个事务(因此数据中的大多数行类似于下面的第6行),因此我的整体数据中大约只有7%具有多个项目篮。这是为什么我没有规则?这就是我尝试取消所有单篮订单的原因,但即便如此也无济于事。

enter image description here

2 个答案:

答案 0 :(得分:0)

我对阿鲁莱斯一无所知,&#39;但问题是它是否可能期望csv而你正在加载excel电子表格?也许尝试使用套餐&#39; openxlsx&#39;首先读取文件,然后将其输入到read.transactions?

答案 1 :(得分:0)

data: { element: this.Element, name: this.name, animal: this.animal } 可以读取格式1和3.使用arules检查项目是否已正确读入。以下是格式3的示例:

summary(sb)