如何计算apache SOLR中每个术语每个文档的出现次数?

时间:2018-09-15 19:36:47

标签: apache http solr

好!我需要获取存储在Solr中的每个文档的搜索词的出现次数(我已为“ PDF”文档建立索引)。
也就是说,如果您具有以下信息:

  • 文档A:出现“ house”一词3次。
  • 文档B:“房子”一词出现了4次。
  • 文档C:单词“ house”出现1次。

因此,如果我搜索“ house”,我需要获得它对文档A来说它出现3次,对B来说4次,对C 1次。总计8次(3 + 4 + 1)。如何在HTTP查询中执行此操作,即“'http://本地主机:8983 / solr / .......”?
非常感谢,问候。

1 个答案:

答案 0 :(得分:0)

我假设您将整个文档编入一个字段(例如文本)。在这种情况下,您可以使用Function Query termfreq返回术语在该字段中显示的次数。

使用函数查询的方法有多种,包括将其放在 fl 字段列表中将其用作伪字段:

http://localhost:8983/solr/corename/select?fl=*,termfreq(text,"house")&q=house