对于我的SOLR设置,我可以对其进行配置,以便当用户搜索数据库中的某些文章时,搜索引擎会对整个正文文本进行全文搜索。
但是,我也有代码执行正文的关键字提取。是否建议仅允许SOLR对文章的关键字执行全文搜索,或者让SOLR仅对文章正文本身执行全文提取更好?
我宁愿不同时做这两件事,其中一件会很好。我的内存有限,只能保留两个字段,关键字或文章正文中的一个。
推理和答案会很好,谢谢。
答案 0 :(得分:0)
是否建议仅允许SOLR对文章的关键字执行全文搜索,或者让SOLR仅对文章正文本身执行全文提取更好?
是的,SOLR非常擅长全文索引。而不是重新发明轮子(搜索算法,停止文字过滤,提升等)让SOLR索引数据库中的内容。如果您需要忽略文章文本中的某些单词,可以在stopwords.txt中配置停用词。