CoreNLP路线图

时间:2019-05-19 14:55:52

标签: stanford-nlp

CoreNLP的路线图尚不清楚。是否处于维护模式?我很高兴看到对StanfordNLP的重视,但是对此方向的缺乏了解令人担忧。如果新的神经模型更好,我们会看到它们被Java CoreNLP API包裹吗?

1 个答案:

答案 0 :(得分:0)

CoreNLP尚未处于维护模式。我们将在整个夏天进行一些相当重要的更改(并且会破坏兼容性)。除其他事项外,我们将转换为使用UDv2(从当前的UDv1开始),我们将对英语以及其他语言进行标记化更改,以更好地与UD和“ new”保持一致(大约从2004年开始!)。 Penn Treebank标记化,我们将拥有更一致的可用性和单词向量的使用。这些更改将增强Java和Python软件包之间的兼容性,并且随着时间的推移,还使我们可以使用更多数据来训练Python stanfordnlp模型。既然Python stanfordnlp v0.2已经发布,那么在CoreNLP上的工作就会开始。

另一方面,斯坦福大学NLP小组的大部分研究精力现在已经转移到在主要的深度学习框架之上探索用Python构建的神经模型。 (希望这并不奇怪!)因此,不太可能将主要的新组件添加到CoreNLP中。很难预测未来,但是可以合理预期CoreNLP将朝着稳定,高效的CPU NLP软件包的方向发展,而不是实现最新的神经模型。