我有一个数据集,其中包含用户在网站上的文本字段中写入的文本。由于网站的性质,大多数用户在该领域多次写作。现在我想看看是否有模式。例如,在某个时间写过的用户" A"将在以后写下" B"。
经过一些谷歌搜索后,我发现TraMineR
作为此类分析的库。但似乎TraMineR
和/或R在状态数上设置了最大值。这是真的还是我做错了什么?解决问题的最佳方法是什么?
有关我的数据集的更多信息:
要创建数据的状态序列对象,我需要使用seqe2stm()
(As explained here)中的TraMineRextras
,其events
的数量超过80000。该函数给出了错误:
矩阵错误(TRUE,nrow = nbstate,ncol = nevent):
无效' nrow'值(太大或NA)
另外:警告信息:
在矩阵中(TRUE,nrow = nbstate,ncol = nevent):
通过强制将NA引入整数范围