格式化时间戳以避免R / TraMineR崩溃?

时间:2013-10-30 13:43:12

标签: r traminer

我有一个序列数据集,其中时间戳是以纪元为单位的秒数:

id      event       time        end
1  723     opened 1356963741 1356963741
2  722     opened 1356931342 1356931342
3  721 referenced 1356988206 1356988206
4  721 referenced 1356988186 1356988186
5  721     closed 1356988186 1356988186
6  721     merged 1356988186 1356988186
7  721     closed 1356988186 1356988186
8  721     merged 1356988186 1356988186
9  721  discussed 1356966433 1356966433
10 721  discussed 1356963870 1356963870

我想创建一个STS序列对象:

sequences.sts <- seqformat(data, from="SPELL", to="STS", 
     begin="time", end="end", id="id", status="event", limit=slmax)
sequences.sts <- seqdef(sequences.sts)
summary(sequences.sts)

然而,当我这样做时,RStudio崩溃了,或多或少冻结了我的整台电脑。通过与其他运行良好的代码进行比较,使用单位数字作为“时间”列,我想我已经将问题确定为时间戳。难道R / RStudio / TraMineR只是从长时间戳中过载了吗?

1 个答案:

答案 0 :(得分:3)

我无法重现这个问题,但最可能的原因是它会产生很长的序列。序列721持续24'336秒。换句话说,我们应该创建一个长度为24'336的序列。根据序列的数量和其他序列,计算时间很长。

问题是我们使用时间戳(秒)的时间单位。您可以尝试使用另一个时间单位,可能会聚合同时发生的事件。

希望这有帮助。