在CloudSearch查询中的特定字段上应用distinct

时间:2014-08-03 12:43:51

标签: search-engine amazon-cloudsearch

我正在研究AWS CloudSearch for system的新搜索引擎。

假设每篇文章都有文章和一些评论。搜索API应返回匹配或具有任何匹配注释的文章。那么有没有办法从单一查询执行的CloudSearch中检索 DISTINCT 值(在这种情况下,文章的唯一ID)?如果没有,使用CloudSearch解决此功能要求的最佳解决方案是什么?

我知道CloudSearch中文档字段的文本数组类型,但更新文档似乎很昂贵,因为单篇文章的N条评论可能超过数千条。

1 个答案:

答案 0 :(得分:1)

我遇到了类似的问题,因为数组元素在cloudsearch中不能超过1000,所以在你的情况下放置注释不是一个选项。我将制作两个搜索域,文章和评论。我将并行发出搜索查询(异步或多线程,具体取决于语言),文章将始终生成非重复的id,但是对于注释查询的结果,您必须仅将逻辑应用于文章ID并始终选择最重要的一个,因为结果按匹配分数排序。