这是使用多变量数据的dtwclust包中的错误吗?

时间:2017-07-21 19:13:46

标签: r time-series cluster-analysis

我使用dtwclust包对时间序列数据进行分类。我使用单变量数据广泛使用它,并弄清楚了它的来龙去脉。使用多变量数据的文档记录不多,但我能够使用DTW和层次聚类使其工作。当我使用DTW和分区聚类尝试它时,绘图功能会返回一个警告,并且绘图本身非常难以理解。这与他们在参考手册中引用的示例数据相同:

        # Multivariate series, provided as a list of matrices
mv <- CharTrajMV[1L:20L]
# Using GAK distance
mvc <- tsclust(mv, k = 4L, distance = "gak", seed = 390,
                args = tsclust_args(dist = list(sigma = 100)))
# Note how the variables of each series are appended one after the other in the plot
plot(mvc)

        Warning messages:
    1: In data.frame(dfm, do.call(rbind, dfm_tcc)) :
      row names were found from a short variable and have been discarded
    2: In data.frame(dfcm, do.call(rbind, dfcm_tc)) :
      row names were found from a short variable and have been discarded

enter image description here

似乎在行下面添加了填充,在单变量情况下不会添加填充。系列也没有&#34;一个接一个地附加&#34;我还不清楚这究竟意味着什么。

在我将此报告为Github上的错误之前,我希望有经验的人可以解释我在这里做错了什么。

1 个答案:

答案 0 :(得分:0)

我刚从作者那里听到,实际上这是一个错误。一个问题已发布到GitHub,将来应该有一个修复。

https://github.com/asardaes/dtwclust/issues/18