R

时间:2015-08-19 20:56:40

标签: r time-series

我有两个时间序列 - 基线(x)和一个事件(y)。我想基于这两个时间序列的不同而聚类。具体来说,我希望创建新功能来预测事件。我对聚类更熟悉,但对时间序列来说还是比较新的。

我在理解有限的情况下尝试了几件不同的事情......

模拟数据......

x<-rnorm(100000,mean=1,sd=10) y<-rnorm(100000,mean=1,sd=10)

此套餐看起来很棒,但SO或Google上的信息有限。

library(TSclust)
d<-diss.ACF(x, y)

d的值是 [,1] [1,] 0.07173596

然后我继续集群...... hc <- hclust(d)

但是我收到以下错误: Error in if (is.na(n) || n > 65536L) stop("size cannot be NA nor exceed 65536") : missing value where TRUE/FALSE needed

我的假设是这个错误是因为我在d中只有一个值。

或者,我在单个时间序列(事件)上尝试了以下内容。

library(dtw) distMatrix <- dist(y, method="DTW") hc <- hclust(y, method="complete")

但需要FOREVER运行距离矩阵。

我对出现问题的方法有几点猜测,但可以使用一些指导。

我的问题......

  1. 我是否需要一组基线和一组事件时间序列?或者一个配对可以开始吗?
  2. 我的时间序列非常大(100000行)。我猜这是导致SLOW distMatrix计算的原因。对此的想法?
  3. 欢迎在大型时间序列上应用群集的任何资源。我做了一个非常彻底的搜索,但我确定有些东西我找不到。
  4. 这是您用来实现这些目标的代码吗?
  5. 谢谢!

0 个答案:

没有答案