Speech Recognizer for 7 fruits(源代码) 使用高斯HMM。每7个班级都有平衡的数据集,每个班级恰好有15个音频。我尝试使用3-5个州,但得分仍然很低。所有其他设置均为默认设置,即遍历HMM。
我知道分数score = hmm_model.get_score(mfcc_features)
返回观察的对数似然,但令人惊讶的是它是负数-1101.0923021
。
概率为np.exp(-1101.0923021) ~= 0
,当我使用一个训练数据样本进行测试时,我认为这种可能性很小。
例如:apple.wav的Apple HMM得分为-1101.0923021
。
是否有增加分数以建立更可靠模型的方法?是否在组件/隐藏层数上进行网格搜索?
(P.S:尽管分数很低,但预测确实不错)