弹性搜索识别类似文档而无需搜索

时间:2017-03-10 22:01:13

标签: elasticsearch lucene spring-data-elasticsearch

假设我在弹性搜索中有以下六条记录( id,text

REC-001 , " Car was damaged"
REC-002 , " Car was damaged on the front "
REC-003 , " My Car got damaged while I was travelling"
REC-004 , " I visited Boulder last week "
REC-005 , " The movie was very scary"
REC-006 , " Your new car looks good"

这些记录中的每一条都将被分析并存储为弹性搜索中的标记。

在这组记录中,我需要找到类似的陈述。我不想解雇任何搜索查询。

在此示例中,前三个记录的标记几乎匹配(Car,损坏)。前两个记录(Car and Damaged)之间有两个单词

我想检索那些共享相似标记的记录。

弹性搜索是否可行?

或者,如果有任何API可以检索给定索引中所有文档中的最大重复标记,我可以检索前n个标记并使用这些标记触发搜索。

0 个答案:

没有答案