对于我们的搜索引擎替换,我们有一套相当困难的要求,它们如下所示。
我们正在考虑将经常/频繁更新的字段制作成子文档。这个问题是我们有一组标签在我们想要近乎实时搜索的记录上频繁更改。我们的应用程序强烈期望在修改此数据时,搜索会立即反映出来。我们已经尝试过子文档,但他们似乎没有像我们对大型数据集那样快速更新。
所以问题如下:
答案 0 :(得分:0)
希望这对其他人有所帮助,这是我提出的解决方案。
由于我将要记录的记录数据拆分为静态和非静态文档,然后将非静态数据分解为更多的子文档,我能够创建高吞吐量索引器。要编制索引的记录总数被拆分为子块,然后进一步拆分为子文档类型。我会将这些块拆分为各种索引器实例,这些实例只会受到数据源吞吐量或ES群集的限制,以确定每秒可以索引多少文档。
这一切都是通过批量API完成的。保持静态数据远离频繁变化的数据允许频繁更改的数据非常快速地更新,并且此速度仅受可用硬件的限制。使用子文档子句和聚合来创建查询有点困难,但一切似乎都有效。
注释