我在elasticsearch索引中有500M条目。每个属于5000个不同来源中的一个(条目具有名为“source”的整数属性)。 现在,要进行搜索,我想通过源代码来提升它们:对于每个源ID,我想要有不同的提升。 提升可以随着时间的推移而改变(例如,每小时一次),因此索引时间提升看起来不是一个好主意。
那么,我该怎么办?
我用谷歌搜索了这个,但没有发现任何真正有用的东西。 我在答案中提出了两个可能的选项,但也许我有更好的选择?答案 0 :(得分:0)
一个选项是将每个类转换为父类作为子条目 - 但是源的所有子项(条目)将被放入相同的分片(并且条目在源之间分布非常不均匀),并且我和# 39; ll需要更改数据库模式,重建数据库并更新所有现有代码。
另一个选择是将每个源放入不同的索引,并使用index_boost。同样的缺点,然后我也需要在查询中提供增强功能(如果我只有5个源,则会有效)。