通过恼人索引向量模型中的最近邻居分页

时间:2019-08-23 02:03:35

标签: machine-learning vector indexing nearest-neighbor annoy

我正在使用Annoy Index建立最近的邻居搜索。查询速度非常快,但是,我遇到的问题是如何实际对结果进行分页/探测?

方法1 抓住前100名(第1页),然后获得前200名(第2页),然后获得前300名(第3页),等等。

  • 缺点:最终,请求会非常大, 搜索将会变慢。

方法2 获得第1页的前100名,然后使用最后几项的向量来创建average_vector。使用average_vector搜索新查询以获取新结果集。每次请求新页面时,都会创建平均向量。

  • 缺点:结果会改变,尤其是如果平均向量 与原始查询向量无关。

是否有更好的方法来处理“树索引”模型的“分页”?

0 个答案:

没有答案