我目前正在使用斯坦福NLP集团的不同工具,并尝试了解它们之间的差异。在我看来,它们彼此相交,因为我可以在不同的工具中使用相同的功能(例如,标记化,POS-Tag,句子可以由Stanford POS-Tagger,Parser和CoreNLP完成)。
我想知道每个工具之间的实际区别是什么,以及我应该在哪些情况下使用它们。
答案 0 :(得分:13)
同一版本中的所有Java类都是相同的,是的,它们重叠。在代码的基础上,解析器和标记器基本上是CoreNLP中可用的子集,除了它们自己有几个小的附加组件,例如解析器的GUI。就提供的模型而言,解析器和标记器提供了一系列语言的模型,而CoreNLP只带有开箱即用的英语。但是,您可以为CoreNLP下载特定于语言的jar,它们提供了我们针对不同语言的所有模型。任何版本中提供的任何内容都存在于CoreNLP github站点中:https://github.com/stanfordnlp/CoreNLP