如何在Apache solr和LingPipe或类似工具中使用实体识别

时间:2013-08-04 09:46:15

标签: solr nlp named-entity-recognition stanford-nlp

我想在使用Apache Solr索引数据时使用NLP。

  1. 识别单词和索引的同义词。

  2. 识别已命名的实体并在编制索引时对其进行标记。

  3. 当有人查询Solr索引时,我应该能够提取出来 从查询中命名实体和意图并形成查询字符串, 这样它就可以有效地搜索索引文件。

  4. 是否有可用的工具/插件来满足我的要求?我相信这是大多数基于内容的网站的常见用例。人们如何处理它?

2 个答案:

答案 0 :(得分:3)

答案 1 :(得分:2)

查看Apache UIMA

具体来说,如果您需要Solr进行命名实体识别,您可以使用SolrUIMA将其与UIMA集成

查看此talk,演示UIMA + Solr。