我正在研究solr 4.8.1版本。我想将solr与NLP集成以提高搜索相关性。我无能为力 找出一个很好的教程,解释它的配置,输出,它对Solr的好处。
尝试了这种配置:
<fieldType name="text_opennlp" class="solr.TextField">
<analyzer>
<tokenizer class="solr.OpenNLPTokenizerFactory"
sentenceModel="opennlp/en-sent.bin"
tokenizerModel="opennlp/en-token.bin"
/>
</analyzer>
</fieldType>
但是这报告了以下错误:
Caused by: org.apache.solr.common.SolrException: Plugin init failure for [schema.xml] fieldType "text_opennlp": Plugin init failure for [schema.xml] analyzer/tokenizer: Error loading class 'solr.OpenNLPTokenizerFactory
答案 0 :(得分:0)
您是否运行了https://issues.apache.org/jira/browse/LUCENE-2899中提及的https://wiki.apache.org/solr/OpenNLP补丁?
它使您能够只保留名词和动词。
提示:检查有效负载中值的分析,因为它们与Treebank示例不同。