Question

我正在研究solr 4.8.1版本。我想将solr与NLP集成以提高搜索相关性。我无能为力找出一个很好的教程，解释它的配置，输出，它对Solr的好处。

尝试了这种配置：

<fieldType name="text_opennlp" class="solr.TextField">
  <analyzer>
    <tokenizer class="solr.OpenNLPTokenizerFactory"
      sentenceModel="opennlp/en-sent.bin"
      tokenizerModel="opennlp/en-token.bin"
    />
  </analyzer>
</fieldType>

但是这报告了以下错误：

Caused by: org.apache.solr.common.SolrException: Plugin init failure for [schema.xml]   fieldType "text_opennlp": Plugin init failure for [schema.xml] analyzer/tokenizer: Error loading class 'solr.OpenNLPTokenizerFactory

Answer 1

您是否运行了https://issues.apache.org/jira/browse/LUCENE-2899中提及的https://wiki.apache.org/solr/OpenNLP补丁？

它使您能够只保留名词和动词。

提示：检查有效负载中值的分析，因为它们与Treebank示例不同。

将solr与NLP集成

1 个答案: