我正在尝试使用数据导入处理程序从mysql导入solr中的数据,现在我想从中识别名称实体。我正在使用searchbox( http://www.searchbox.com/named-entity-recognition-ner-in-solr/)。我在哪里 使用stanford ner识别名称实体。
<requestHandler name="/dataimport"
class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-import.xml</str>
</lst>
</requestHandler>
用于从mysql和
导入数据<requestHandler name="/ner" class="com.searchbox.ner.NerHandler" />
<updateRequestProcessorChain name="mychain" >
<processor class="com.searchbox.ner.NerProcessorFactory" >
<lst name="queryFields">
<str name="queryField">content</str>
</lst>
</processor>
<processor class="solr.LogUpdateProcessorFactory" />
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>
<requestHandler name="/update" class="solr.UpdateRequestHandler">
<lst name="defaults">
<str name="update.chain">mychain</str>
</lst>
</requestHandler>
用于识别名称实体。 NER请求处理程序识别名称实体 来自内容字段,但将提取的实体存储在solr字段中。
当我使用带有solr的nutch时,NER请求处理程序正在工作。但是当我 我从mysql导入数据,没有调用ner请求处理程序。所以 对于导入的文档,实体不存储在solr中。任何人都可以告诉我 如何在数据导入处理程序中调用自定义请求处理程序。
否则,如果我可以在外部调用ner请求处理程序,那么它可以 索引人,组织和进口文件的位置。 欢迎提出任何建议。