所以我想为隐藏的马尔可夫模型训练一个非常大的特征数组: 700 x(400 x 4122),其中每个400x4122迷你阵列是400个时间戳中具有4122个特征的观察样本序列。当连接时,总共有700个这样的序列,相当于~45GB的内存。我的问题是:你如何使用这个大小的数组呢?
在 hmmlearn python包中,通常使用多个序列,如下所示:
x1 - >一个400x4122序列
x2 - >另一个400x4122序列
...
xn - >第700个400x4122序列
X = np.concatenate(x1,x2,...,xn)
lengths = [len(x1),len(x2),...,len(xn)]
model = GaussianHMM(n_component = 6,...)。fit(X,length = lengths)
换句话说,需要连接整个序列数组并将其输入训练函数。但是,我想知道是否有办法一次提供一个400x4122序列,因为整个连接数组太大而无法使用。
提前致谢。