如何在Solr上使用MoreLikeThis函数来查找与文本文件类似的文档?

时间:2013-03-07 18:42:11

标签: apache solr lucene morelikethis

我正在尝试使用solr来执行以下操作:

从txt文件中读取一些文本,并在文本上使用MoreLikeThis来查找与该文本类似的文档。我怎么能用Solr做到这一点?

据我所知,到目前为止我认为我必须使用内容流,但我不知道如何配置...

1 个答案:

答案 0 :(得分:1)

如果您从存储在索引中的文档中形成MoreLikeThisQuery,它将通过从索引中检索TermVector信息来形成查询。

由于您愿意找到类似于您所拥有的文本文件的文档,因此您必须迭代文本文件并使用文本文件中的术语(您希望匹配的方式)形成BooleanQuery。

以上情况对Lucene来说都是如此,我认为Solr也是如此,考虑到MoreLikeThisQuery基于TermVector信息工作。