TraMineR中的最大状态数?

时间:2016-01-23 16:10:51

标签: r sequence traminer pattern-mining

我有一个数据集,其中包含用户在网站上的文本字段中写入的文本。由于网站的性质,大多数用户在该领域多次写作。现在我想看看是否有模式。例如,在某个时间写过的用户" A"将在以后写下" B"。

经过一些谷歌搜索后,我发现TraMineR作为此类分析的库。但似乎TraMineR和/或R在状态数上设置了最大值。这是真的还是我做错了什么?解决问题的最佳方法是什么?

有关我的数据集的更多信息:

  • 有超过一百万条日志的文字输入
  • 约90000名不同用户
  • 大约80000种不同的输入(事件/状态?)

要创建数据的状态序列对象,我需要使用seqe2stm()As explained here)中的TraMineRextras,其events的数量超过80000。该函数给出了错误:

  

矩阵错误(TRUE,nrow = nbstate,ncol = nevent):
    无效' nrow'值(太大或NA)
  另外:警告信息:
  在矩阵中(TRUE,nrow = nbstate,ncol = nevent):
    通过强制将NA引入整数范围

0 个答案:

没有答案