我正在使用HMM进行场景文本识别。我很怀疑scikit-learn HMM代码用于训练和预测与HTK相比的速度,因为sklearn HMM是用Python编写的。
我的数据非常庞大(数十千兆字节),因此速度是一个关键问题。
希望有人可以分享一些经验。
答案 0 :(得分:2)
HMM的sklearn实现已外部化为:https://github.com/hmmlearn/hmmlearn
还有:https://github.com/jmschrei/yahmm
我不知道哪个更快,也不知道他们是否可以与HTK比较。