正在推动DSE SOLR实施的轮胎。 这是一个架构代码段:
<!-- A text field that only splits on whitespace for lowercase matching of words -->
<fieldType name="lowtokens" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
<!-- ind name individual name synonyms on first token only (firstname) -->
<fieldType name="basename" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" />
<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonym_ind.txt" ignoreCase="true" expand="true"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" />
<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
以下是同义词文件中的一些行:
alan, al
alberta, berta, bertie, al, albie, bert, berto, burt
gregory, gre, greg, gregg, gregor, greig, grieg
因此,在Solr Analyzer页面中,索引不会将Alan扩展为Alan和Al Greg等也一样。
从solr获取它,它似乎已加载好了:
curl -X GET http://localhost:8983/solr/resource/search.cust/synonym_ind.txt
synonym_ind.txt
它只返回名称而不是错误。 UNIX格式的文件是38607字节。 救命?有人使用DSE SOLR吗?遗憾的是,Datastax关闭了他们的论坛......
答案 0 :(得分:0)
您是如何上传同义词文件的?
上传同义词文件后,您是否强制重新加载Solr核心?
curl "http://localhost:8983/solr/admin/cores?action=RELOAD&name="
curl "http://localhost:8983/solr/admin/cores?action=RELOAD&name=&reindex=true&deleteAll=true"