我必须实施一个经过特殊训练的有监督的词性标记器,我一直在研究几种技术,包括最大似然,感知器和大边距(SVM)。最后,在阅读了一些研究论文中引用的一些实验结果之后,我已经开始使用SVM来实现它。我已经研究了一段时间,理论上的一些事情似乎有点令人困惑。 有人可以请我指出一些实际实施的相关阅读材料,或者更多关于如何使用维特比算法实现它的说明。
P.S。 :我不是要求解决方案,而是需要一些指导。
答案 0 :(得分:1)
我建议,阅读一些经典论文。
使用Python NLTK中的Maxent进行逐步构造paper:
您还可以学习一些开源软件,例如Apache OpenNLP,Python NLTK或我自己的实施PurePos