我正在努力争取R中arulesSequences的输入 我的数据,让我们调用数据帧df,看起来像这样
sequenceID eventID SIZE event
1 1 1 1 E_351-
2 1 2 1 1-
3 2 1 1 30006+
4 2 2 1 20198+
5 2 3 1 111+
6 2 4 1 610-
7 2 5 1 26+
8 2 6 1 30006-
9 2 7 2 11+, 11
下一步(df,“transactions”)给出以下错误
asMethod(object)中的错误: 无法使用重复项目的交易强制列表 电话:as ... .nextMethod - > callNextMethod - > .nextMethod - > as - > asMethod
我花了两天的时间尝试在cspade中输入我的数据但没有成功!
答案 0 :(得分:2)
经过多次尝试和失败后,我设法将文件转换为事务对象。 那些会挣扎的人的伎俩: 我不得不删除逗号(使用paste而不是toString) 我在csv fil中编写了表格:BEAWARE:没有标题,没有rownames或带有read-baskets的导入将失败。希望这有助于未来的用户。
答案 1 :(得分:1)
我这样做类似于你。我还包括一个大小列,我在另一个例子中看到它,我不知道它做了什么。 我的数据是这样的,但是> 200 000个唯一身份证。
mytxt <- data.frame(ID=c(1,1,1,2,2),
Time=c(1,2,3,1,2),
Size=1,
Event=c("A","B","E", "B","A"))
我只是将其保存为没有列名或行名的txt文件。
write.table(mytxt, "C:\\mytxt.txt", sep=" ", row.names = FALSE, col.names = FALSE, quote = FALSE)
然后我用下面的行读了它
data <- read_baskets(con = "C:\\mytxt.txt", info = c("sequenceID","eventID","SIZE"))
所以它与您在评论中描述的内容类似。