Python:通过hmmlearn传递多个LARGE序列

时间:2016-10-27 21:41:26

标签: python arrays scikit-learn hmmlearn

所以我想为隐藏的马尔可夫模型训练一个非常大的特征数组: 700 x(400 x 4122),其中每个400x4122迷你阵列是400个时间戳中具有4122个特征的观察样本序列。当连接时,总共有700个这样的序列,相当于~45GB的内存。我的问题是:你如何使用这个大小的数组呢?

hmmlearn python包中,通常使用多个序列,如下所示:

  

x1 - >一个400x4122序列

     

x2 - >另一个400x4122序列

     

...

     

xn - >第700个400x4122序列

     

X = np.concatenate(x1,x2,...,xn)

     

lengths = [len(x1),len(x2),...,len(xn)]

     

model = GaussianHMM(n_component = 6,...)。fit(X,length = lengths)

换句话说,需要连接整个序列数组并将其输入训练函数。但是,我想知道是否有办法一次提供一个400x4122序列,因为整个连接数组太大而无法使用。

提前致谢。

0 个答案:

没有答案