索尔可以索引句子而不是网页吗?

时间:2011-10-30 21:43:55

标签: search solr lucene

我刚刚设置了Solr,索引了一些页面(使用Nutch抓取),我现在可以搜索。

我现在需要将其更改为索引句子而不是网页。我需要的结果是,例如,搜索“一个单词”并获得包含“一个”和/或“单词”的所有句子的列表。

我是Solr的新手,所以任何指向我应该从哪里开始实现这一点的指针都会非常有帮助。它可能吗?或者有一种简单的方法可以做到这一点我错过了吗?

1 个答案:

答案 0 :(得分:1)

是。 Solr索引'文件'。您可以通过REST-ful端点向您发布的内容定义文档的内容。如果你一次推一个句子,它一次索引一个句子。

如果你的意思是'我可以推文件,把solr分成句子并单独索引每一个',那么答案是,我认为,在Solr里面不是很容易。如果你正在使用Nutch,我建议把分裂放到Nutch中,这样它一次只能给solr一个句子。

分析链和update request processors都没有规定将文档拆分为更小的文档。您可能也会考虑使用弹性搜索替代方案,尽管我没有具体的知识可以向下滑动导致您的解决方案。