在我看到的所有离散HMM中,观察数据由整数流组成。然而,如果观测实际上是离散特征向量会发生什么?例如,如果我尝试使用HMM来学习视频帧的灰度强度值的手势识别,该怎么办?也就是说,每个观察都是用nxn矩阵来描述的,而不是单个值?我该怎么做呢?
谢谢!
答案 0 :(得分:0)
您可以使用离散的Multinomial distribution作为HMM的发射组件。例如,每个状态都会发出一个长度为n*n
的整数数组,其值介于0到255之间,表示像素强度(灰度)。
当然,如果值是连续的(浮点数),只需使用多元正态分布。
答案 1 :(得分:0)
根据您要使用的库,ObservationVectors
可能会很好用。您可以将矩阵展平为n²维向量,并使用经过验证的数据训练模型。然后,您可以从一系列矢量观察中检测到任何手势。