在Solr中是否有办法通过与另一个术语的距离来获得术语列表,类似于可以通过文档中的计数返回术语的术语成员?
例如,如果我将以下文本编入索引:
快速的棕色狐狸跳过懒狗。
和
狐狸说什么?
我搜索了“狐狸”一词,我希望得到以下结果:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">7</int>
</lst>
<lst name="terms">
<lst name="text">
<int name="brown">0</int>
<int name="jumped">0</int>
<int name="say">0</int>
<int name="the">1</int>
<int name="quick">1</int>
<int name="over">1</int>
<int name="does">1</int>
<int name="what">2</int>
<int name="lazy">3</int>
<int name="dogs">4</int>
</lst>
</lst>
</response>
在这个例子中,我使用非常简单的算法来计算值(total_word_distance / number_of_docs_appeared)。例如,&#39;&#39;发生在两个文档中,一个距离为0,另一个距离为2,因此(0 + 2) / 2
给出1的答案。
同样,我要问的是,如果这样的事情已经存在,如果不存在,那么会怎样做呢?