标签: nlp stanford-nlp pos-tagger part-of-speech
我有一个预先标记化的文本作为斯坦福词性标注器的输入。它根本无法正确标记括号和引号。我不想要Stanford Tagger的默认标记化,因此我使用Penn Treebank选项禁用了它。
Penn Treebank
我知道我们应该-LRB- -RRB-在标记化过程中执行的方式,例如将括号转换为post和search,standalone Stanford Parser支持。
-LRB-
-RRB-
post
search
有没有办法在斯坦福词性标注器中很好地处理它?</ p>