opennlp vs corenlp:市场覆盖面 - 受欢迎程度

时间:2017-05-25 08:26:45

标签: parsing nlp stanford-nlp opennlp

我正在进行开源NLP工具的比较研究,并了解openNLP和coreNLP引擎的功能/服务。在最近的过去,我看到没有为openNLP论坛做出贡献,因为coreNLP论坛仍然活跃。所以我想了解stanford:coreNLP是否已经变得更受欢迎并被广泛用于商业应用?有人对此有所了解吗?

1 个答案:

答案 0 :(得分:7)

Apache OpenNLP正在积极开发中。看一下提交历史[1],不同的贡献者几乎每天都会做出提交,今年它们会删除4个版本(1.7.0,1.7.1,1.7.2,最近只有1.8.0)。

OpenNLP是根据公司友好的Apache License 2.0获得许可的,而CoreNLP是根据GPL许可的,很难在商业软件中使用(例如,分发的软件也必须在GPL下发布),但它们正在销售商业许可。

OpenNLP主要由在其生产系统中运行的公司开发,其中CoreNLP由斯坦福大学的研究人员制作。

CoreNLP有很多依赖项,这些依赖项会被引入您的项目,其中OpenNLP没有依赖项。

OpenNLP可以为您提供以下任务:

  • 句子检测
  • 标记化
  • 分块
  • 命名实体识别
  • Pos标记
  • 解析
  • 词干
  • 语言模型
  • 词形还原
  • 文件分类

OpenNLP具有高度可定制性,易于培训用户数据,支持许多公开语料库的培训,并具有内置评估功能,可用于衡量每个组件的性能。

CoreNLP支持以下任务:

  • 句子检测
  • 标记化
  • 命名实体识别
  • Pos标记
  • 解析(也是依赖解析)
  • 共指
  • 词形还原
  • 关系提取

[1] https://github.com/apache/opennlp/commits/master