将solr与NLP集成

时间:2014-07-09 08:04:15

标签: search solr lucene nlp

我正在研究solr 4.8.1版本。我想将solr与NLP集成以提高搜索相关性。我无能为力 找出一个很好的教程,解释它的配置,输出,它对Solr的好处。

尝试了这种配置:

<fieldType name="text_opennlp" class="solr.TextField">
  <analyzer>
    <tokenizer class="solr.OpenNLPTokenizerFactory"
      sentenceModel="opennlp/en-sent.bin"
      tokenizerModel="opennlp/en-token.bin"
    />
  </analyzer>
</fieldType>

但是这报告了以下错误:

Caused by: org.apache.solr.common.SolrException: Plugin init failure for [schema.xml]   fieldType "text_opennlp": Plugin init failure for [schema.xml] analyzer/tokenizer: Error loading class 'solr.OpenNLPTokenizerFactory

1 个答案:

答案 0 :(得分:0)

您是否运行了https://issues.apache.org/jira/browse/LUCENE-2899中提及的https://wiki.apache.org/solr/OpenNLP补丁?

它使您能够只保留名词和动词。

提示:检查有效负载中值的分析,因为它们与Treebank示例不同。