我可以在斯坦福解析器中选择一个pos.model吗?

时间:2014-12-15 16:00:06

标签: stanford-nlp

我想在Stanford解析器解析过程中使用gate-EN-twitter.model进行pos标记。命令行上有一个选项吗?像-pos.model gate-EN-twitter.model?或者我是否必须首先使用带有门模型的Stanford pos tagger进行标记,然后将其输出用作解析器的输入?

谢谢!

1 个答案:

答案 0 :(得分:1)

如果我理解正确,您希望强制斯坦福分析师使用此特定于Twitter的标记器生成的标记。这绝对是可能的,尽管斯坦福大学NLP关于这个确切模型的推文应该作为警告:

  

来自斯坦福NLP的推文,2014年4月13日:

     

在社交媒体上使用CoreNLP?试试GATE Twitter模型(如果不解析...) -pos.model gate-EN-twitter.model https://gate.ac.uk/wiki/twitter-postagger.html #nlproc

     

https://twitter.com/stanfordnlp/status/455409761492549632

话虽如此,如果你真的想尝试,我们不能阻止你:)

在您自己的代码中强制parser FAQ entry。见http://nlp.stanford.edu/software/parser-faq.shtml#f

基本上,您有两种选择(有关详细信息,请参阅常见问题解答):

  • 如果从命令行调用解析器,则可以预先标记文本文件,然后使用某些命令行选项向解析器发出预先标记文本的事实。
  • 如果以编程方式解析,LexicalizedParser#parse方法将接受任何List<? extends HasTag>并将该列表中的标记视为黄金。只需预先标记您的列表(使用CoreNLP管道或MaxentTagger)并将该令牌列表传递给解析器。