我想在Stanford解析器解析过程中使用gate-EN-twitter.model进行pos标记。命令行上有一个选项吗?像-pos.model gate-EN-twitter.model
?或者我是否必须首先使用带有门模型的Stanford pos tagger进行标记,然后将其输出用作解析器的输入?
谢谢!
答案 0 :(得分:1)
如果我理解正确,您希望强制斯坦福分析师使用此特定于Twitter的标记器生成的标记。这绝对是可能的,尽管斯坦福大学NLP关于这个确切模型的推文应该作为警告:
来自斯坦福NLP的推文,2014年4月13日:
在社交媒体上使用CoreNLP?试试GATE Twitter模型(如果不解析...)
-pos.model gate-EN-twitter.model
https://gate.ac.uk/wiki/twitter-postagger.html #nlproc
话虽如此,如果你真的想尝试,我们不能阻止你:)
在您自己的代码中强制parser FAQ entry。见http://nlp.stanford.edu/software/parser-faq.shtml#f
基本上,您有两种选择(有关详细信息,请参阅常见问题解答):
LexicalizedParser#parse
方法将接受任何List<? extends HasTag>
并将该列表中的标记视为黄金。只需预先标记您的列表(使用CoreNLP管道或MaxentTagger
)并将该令牌列表传递给解析器。