删除POS标签的标签

时间:2012-03-14 10:01:06

标签: java stanford-nlp pos-tagger

是否可以从句子中删除标签?可以通过扫描文件并查找标签并删除标签来实现它,但由于标签很多(有些模型有30多个,有些模型大约有48-50个,它们基本上都遵循penn treebank pos tags),有没有快速而甜蜜的方式以更有效的方式删除标签? 我确实检查了API,但是没有删除标签的方法。

1 个答案:

答案 0 :(得分:1)

没有内置任何特殊内容,但由于输出包含单词及其标记,我不确定为什么需要再次扫描原始文档。您是否可以通过从最后一个tagSeparator字符('/'或其他)中删除标记来删除标记,直到空白?或者,使用

可能更简单
-outputFormat tsv

然后,您将获得两列输出,第一列中的单词和第二列中的标记,您可以在完成后保留第一列。