如何处理solr相似性整个索引数据库

时间:2012-03-11 17:15:29

标签: solr similarity

我怎样才能找到20个文件:

  • 与内容
  • 相似
  • 通过内容相互较低的相似性

1 个答案:

答案 0 :(得分:2)

Solr MoreLikeThis功能可以帮助您获取内容相似的文档。 相似性基于文档中出现的频繁术语 系统将查询这些术语以获取类似文档。

如果您希望对文档进行分组,则需要使用不同的工具来对文档进行分组。您可以检查Apache Mahout的群集 这将使用TD / IDF方法将文档分组。