TraMineR中是否有建议的格式或方法用于长度超过300个事件的序列?

时间:2016-08-25 19:23:40

标签: sequence traminer

我正在处理长达300多个事件的带时间戳的事件序列。此数据类似于网络日志,用户在不同时间点击网站的不同页面。一个序列可以是一个Web会话,每个事件是用户动作(访问页面,单击按钮等)。

我首先使用TSE格式。当试图使用seqefsub()TraMineR挂起来查找子序列时。我设置maxk = 5并且它工作(这将要搜索的子序列的长度限制为5个事件)。但是,maxK 6或更高也会挂起。不知道为什么这突然下降。此外,当我将事件序列修剪为仅15个事件的长度时,一切都很好。很明显,事件序列长度是一个问题。

是否存在对序列长度更稳健的不同格式,例如STS?在TraMineR中是否还有其他建议来处理这个长度的序列?

1 个答案:

答案 0 :(得分:1)

问题与用于输入序列的格式无关。

TraMineR只有一个用于搜索子序列的基本算法。

我建议你为你的问题寻找更合适的工具。例如考虑R包arulesSequences