斯坦福词性标注器不能在预标记化文本中标记括号和引号

时间:2015-08-11 02:39:42

标签: nlp stanford-nlp pos-tagger part-of-speech

我有一个预先标记化的文本作为斯坦福词性标注器的输入。它根本无法正确标记括号和引号。我不想要Stanford Tagger的默认标记化,因此我使用Penn Treebank选项禁用了它。

我知道我们应该-LRB- -RRB-在标记化过程中执行的方式,例如将括号转换为postsearchstandalone Stanford Parser支持。

有没有办法在斯坦福词性标注器中很好地处理它?<​​/ p>

0 个答案:

没有答案