隐马尔可夫模型:处理删除/插入

时间:2018-05-12 06:31:50

标签: nlp hidden-markov-models hmmlearn

我正在阅读并试图了解HMM和我正在寻找的区域是用于拼写纠正。我没有得到的一件事是它如何处理插入或删除。 让我们说有一个字符级模型,其中预期状态是'c','a','t'。现在说观察到的状态是'c','t'。现在,当建立模型时,将从“c”转换为“a”,而不是从“c”转换为“t”。现在在纠正或预测短语中如何处理插入字符'a'的情况而不是?

希望我对这个问题很清楚。感谢。

1 个答案:

答案 0 :(得分:0)

单个HMM是单个字符'c'''t'的模型。要处理插入/删除,您需要来自HTK的解码器,如HVite或HDecode。解码器从hmms和一些语法中做出决定。例如,当它发现'c''t'时,它将以语言/语法的一些成本/概率进行查找。例如,它将结束单词应该是'cat',因为它在语法中而'ct'不是。