Solr中的命名实体识别

时间:2015-01-31 09:52:54

标签: mysql solr lucene named-entity-recognition

我正在尝试使用数据导入处理程序从mysql导入solr中的数据,现在我想从中识别名称实体。我正在使用searchbox( http://www.searchbox.com/named-entity-recognition-ner-in-solr/)。我在哪里 使用stanford ner识别名称实体。

<requestHandler name="/dataimport"
class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
 <str name="config">data-import.xml</str>
 </lst>
</requestHandler>

用于从mysql和

导入数据
<requestHandler name="/ner" class="com.searchbox.ner.NerHandler" />
  <updateRequestProcessorChain name="mychain" >
   <processor class="com.searchbox.ner.NerProcessorFactory" >
     <lst name="queryFields">
       <str name="queryField">content</str>
     </lst>
   </processor>
   <processor class="solr.LogUpdateProcessorFactory" />
   <processor class="solr.RunUpdateProcessorFactory" />
 </updateRequestProcessorChain>

 <requestHandler name="/update" class="solr.UpdateRequestHandler">
       <lst name="defaults">
         <str name="update.chain">mychain</str>
       </lst>
  </requestHandler>

用于识别名称实体。 NER请求处理程序识别名称实体 来自内容字段,但将提取的实体存储在solr字段中。

当我使用带有solr的nutch时,NER请求处理程序正在工作。但是当我 我从mysql导入数据,没有调用ner请求处理程序。所以 对于导入的文档,实体不存储在solr中。任何人都可以告诉我 如何在数据导入处理程序中调用自定义请求处理程序。

否则,如果我可以在外部调用ner请求处理程序,那么它可以 索引人,组织和进口文件的位置。 欢迎提出任何建议。

1 个答案:

答案 0 :(得分:0)

我不确定这会回答您的问题,但您可以在致电时指定更新链

 /update?update.chain=yourchain

source)或使用

制作一个默认链
<updateRequestProcessorChain name="NERchain" default="true">

source