从文本中提取产品实体

时间:2014-11-16 04:09:10

标签: java named-entity-recognition

我尝试使用命名实体识别器从给定文本中提取产品名称。


  输入文字:“谷歌使谷歌适合”
  预期输出: Google Fit (产品)

有没有可用的工具? (我测试了 Alchemy API ,它与提取产品名称无关)
如果没有这样的工具,我怎样才能建立自己的训练模型来实现这个目标?

1 个答案:

答案 0 :(得分:1)

Apache OpenNLP库是一个基于机器学习的工具包,用于处理自然语言文本。

它支持最常见的NLP任务,例如标记化,句子分段,词性标注,命名实体提取,分块,解析和共指消解。通常需要这些任务来构建更高级的文本处理服务。 OpenNLP还包括最大熵和基于感知器的机器学习。

一些例子:Click Here