标签: machine-learning vector indexing nearest-neighbor annoy
我正在使用Annoy Index建立最近的邻居搜索。查询速度非常快,但是,我遇到的问题是如何实际对结果进行分页/探测?
方法1 抓住前100名(第1页),然后获得前200名(第2页),然后获得前300名(第3页),等等。
方法2 获得第1页的前100名,然后使用最后几项的向量来创建average_vector。使用average_vector搜索新查询以获取新结果集。每次请求新页面时,都会创建平均向量。
average_vector
是否有更好的方法来处理“树索引”模型的“分页”?