在Google自定义搜索API中,似乎在response.queries.request [0]对象中返回的“totalResults”字段会在搜索结果的最后一页上减少。例如,如果搜索总共有17个结果,并且我发送了一个附加了“& start = 11”的相同请求,则“response.queries.request [0] .totalResults”的值从17下降到12。
我不确定是什么导致这种情况,或者它是否在我的结尾(谷歌可能在事后过滤掉重复的条目吗?)。
答案 0 :(得分:2)
这不是你的最终目标,而是谷歌本身的一个问题。您可以直接在Google上尝试相同的查询,您会发现在分页结束时总结果不一致。不确定为什么,但是当你有大量的数据要处理,在大型基础设施上并行处理,以及大量动态因素作用时,这种问题并不罕见。是的,可以重复条目过滤,版权删除等。
如果您正在计算自己的起始索引,那么如果收到的新总结果低于起始索引,您可以做的是调整起始索引。但最好使用来自API的起始索引。