我有一个数据框,我正试图强制进入一个事务对象,以便使用arules
包进行分析。这是我的问题的可重现的例子:
df <- data.frame(
case_number = c("1001", "1001", "1002", "1002", "1003"),
date = as.Date(c("2016-04-19", "2016-04-21", "2016-05-21", "2016-05-25",
"2016-06-14")),
happy = factor(c("Yes", "No", "Yes", "No", "No")),
food = ordered(
c(1, 2, 1, 3, 1),
levels = c(1, 2, 3),
labels = c("A lot", "Some", "None")
),
stringsAsFactors = FALSE
)
df
case_number date happy food
1 1001 2016-04-19 Yes A lot
2 1001 2016-04-21 No Some
3 1002 2016-05-21 Yes A lot
4 1002 2016-05-25 No None
5 1003 2016-06-14 No A lot
如果我放弃case_numer和date,我没有遇到麻烦。但是,在introduction to arules示例1中,Epub事务对象的摘要包括以下内容:
includes extended transaction information - examples:
transactionID TimeStamp
10792 session_4795 2003-01-01 19:59:00
10793 session_4797 2003-01-02 06:46:01
10794 session_479a 2003-01-02 09:50:38
您可以使用以下代码自行重新创建:
library(arules)
data(Epub)
summary(Epub)
我的问题是,如何将case_number
和date
添加为扩展交易信息,如上所述。我查看了arules文档和这个SO post。
答案 0 :(得分:0)
可以使用方法transactionInfo
访问交易信息(请参阅? transactions
)。它包含一个data.frame,每个事务占一行。