如何将数据拟合到隐马尔可夫模型sklearn / hmmlearn

时间:2015-10-16 18:13:52

标签: python scikit-learn hidden-markov-models hmmlearn

我将时间序列数据设置为csv文件,其中包含以下列 -

ID,TIMESTAMP,MEASUREMENTS[10]

对于ID,在进行这些测量时,会有多个测量值和相关的时间戳。列测量包含10个测量的列表。一条记录中的测量值(与特定时间戳相关联)在某种程度上取决于先前的记录。

例如。数据集:

ID,TIMESTAMP,MEASUREMENTS
1,0,[123,456,567.....]
1,100,[....]
1,350,[....]
2,0,[....]
2,200,[.....]

此外,测量数组在某些索引处包含NaN。 最后,我有一些与每个ID相关联的标签,这是执行测量的结果,直到该id的最后一个时间戳。 我的目标是将这些数据拟合到HMM模型中,然后预测具有相同格式的测试数据集的标签。 如何将此模型从 sklearn / hmmlearn 纳入HMM模型? sklearns文档不符合模型的标记,不解释任何参数。

1 个答案:

答案 0 :(得分:2)

由于您的问题需要预测序列的标签。您应该使用seqlearn这是一个序列分类工具。

此外,在HMM中拟合数据需要一些预处理,因为它接受数组列表。您可以按时间升序连接时间戳和与每个ID关联的三个度量。这会为每个ID提供一个长度为33的序列。

如果您需要进一步的帮助,请与我们联系。我最近使用HMMLearn进行了一个项目。