为arulesSequence准备数据

时间:2016-06-06 13:28:13

标签: r arules

我正在努力争取R中arulesSequences的输入 我的数据,让我们调用数据帧df,看起来像这样

 sequenceID eventID SIZE    event
1           1       1    1   E_351-
2           1       2    1       1-
3           2       1    1   30006+
4           2       2    1   20198+
5           2       3    1     111+
6           2       4    1     610-
7           2       5    1      26+
8           2       6    1   30006-
9           2       7    2 11+, 11

下一步(df,“transactions”)给出以下错误

  asMethod(object)中的

错误:     无法使用重复项目的交易强制列表   电话:as ... .nextMethod - > callNextMethod - > .nextMethod - > as - > asMethod

我花了两天的时间尝试在cspade中输入我的数据但没有成功!

2 个答案:

答案 0 :(得分:2)

经过多次尝试和失败后,我设法将文件转换为事务对象。 那些会挣扎的人的伎俩: 我不得不删除逗号(使用paste而不是toString) 我在csv fil中编写了表格:BEAWARE:没有标题,没有rownames或带有read-baskets的导入将失败。希望这有助于未来的用户。

答案 1 :(得分:1)

我这样做类似于你。我还包括一个大小列,我在另一个例子中看到它,我不知道它做了什么。 我的数据是这样的,但是> 200 000个唯一身份证。

mytxt <- data.frame(ID=c(1,1,1,2,2),
                Time=c(1,2,3,1,2),
                Size=1,
                Event=c("A","B","E", "B","A"))

我只是将其保存为没有列名或行名的txt文件。

write.table(mytxt, "C:\\mytxt.txt", sep=" ", row.names = FALSE, col.names = FALSE, quote = FALSE)

然后我用下面的行读了它

data <- read_baskets(con = "C:\\mytxt.txt", info = c("sequenceID","eventID","SIZE"))

所以它与您在评论中描述的内容类似。