我有以下示例数据
Timestamp,Col1,Col2,Col3,Col4,Col5
2/11/2016 22:59:24,1,1,1,0,0
2/12/2016 14:43:01,0,0,0,0,0
2/12/2016 15:19:37,1,1,1,1,0
2/13/2016 17:33:38,1,1,1,0,1
2/14/2016 15:59:31,1,1,1,1,0
我已将其作为R中的数据对象导入。
我想使用arules
库来分析它。
但到目前为止,我只能执行以下代码:
require(arules)
data(package="arules")
data(Groceries)
Groceries
summary(Groceries)
itemFrequencyPlot(Groceries,topN=20,type="absolute")
rules <- apriori(Groceries, parameter = list(supp = 0.0001, conf = 0.8))
我不明白为什么这些功能不适用于我的数据对象。
有些人可以解释一下如何让这些功能处理我的CSV数据吗?我认为这只是用正确的功能正确格式化它的问题,但我不知道该怎么做。
答案 0 :(得分:1)
你可以做到
MyData <- read.csv(text="Timestamp,Col1,Col2,Col3,Col4,Col5
2/11/2016 22:59:24,1,1,1,0,0
2/12/2016 14:43:01,0,0,0,0,0
2/12/2016 15:19:37,1,1,1,1,0
2/13/2016 17:33:38,1,1,1,0,1
2/14/2016 15:59:31,1,1,1,1,0")
require(arules)
trans <- as(MyData[,-1]>0, "transactions")
rules <- apriori(trans, parameter = list(supp = 0.0001, conf = 0.8))