应用错误收集

如果我理解正确，您希望强制斯坦福分析师使用此特定于Twitter的标记器生成的标记。这绝对是可能的，尽管斯坦福大学NLP关于这个确切模型的推文应该作为警告：

来自斯坦福NLP的推文，2014年4月13日：

在社交媒体上使用CoreNLP？试试GATE Twitter模型（如果不解析...） -pos.model gate-EN-twitter.model https://gate.ac.uk/wiki/twitter-postagger.html #nlproc

（https://twitter.com/stanfordnlp/status/455409761492549632）

话虽如此，如果你真的想尝试，我们不能阻止你：）

在您自己的代码中强制parser FAQ entry。见http://nlp.stanford.edu/software/parser-faq.shtml#f

基本上，您有两种选择（有关详细信息，请参阅常见问题解答）：

如果从命令行调用解析器，则可以预先标记文本文件，然后使用某些命令行选项向解析器发出预先标记文本的事实。
如果以编程方式解析，LexicalizedParser#parse方法将接受任何List<? extends HasTag>并将该列表中的标记视为黄金。只需预先标记您的列表（使用CoreNLP管道或MaxentTagger）并将该令牌列表传递给解析器。

我可以在斯坦福解析器中选择一个pos.model吗？

1 个答案: