我的序列数据帧有问题。示例数据帧如下所示。我想找到最重要的序列(序列的顺序很重要):
1,left,right,forward,back
2,forward,left,right,back,left,right
3,left,left,right,right
4,forward,left
5,left,right,forward,back,back,right,right,back,back
我通过使用以下代码将此数据读入R:
data <- read.transactions(data='pathmydata',
format='basket',
sep='c',
cols=c(1),
rm.duplicates = F)
我成功地获得了常见的食物(例如,eclat或apriori)。但是,arulesSequences包的cspade算法也需要一个sequenceID。我认为这很好,因为我在上面的代码中定义了使用cols = c(1)函数。我这样称呼它:
cspade(data = data,
parameter = list(support = 0.8, maxlen=5, minlen=2, maxgap=1))
这会导致以下错误:
Error in cspade(data = data, paremeter = list(support = 0.8, maxlen=5, :
transactionInfo: missing 'sequenceID'and/or eventID'.
但是,我不知道如何告诉cspade函数这里的第一列是序列ID。有人知道吗?我也不知道如何告诉函数我确实没有eventID(或者sequenceID和eventID是否相同?)。