当我尝试获取第430页的wget请求时,我获得了重定向302。
wget "https://www.zalando.be/kleding/?p=430"
产生
HTTP-verzoek is sent; waiting on answer... 302 Moved Temporarily
Location: /kleding/?p=429 [following...]
--2018-11-10 21:08:57-- https://www.zalando.be/kleding/?p=429
但是,当我访问该网站并按下下一页的按钮时,它将转到“ https://www.zalando.be/kleding/?p=430”。
我不知道这怎么可能,有人可以替我详细说明吗?
还有可能在shell中执行此操作吗?
答案 0 :(得分:1)
因此,似乎通过wget
访问或直接在浏览器的地址栏中输入 p 值大于429的站点的URL将触发 302重定向。
在按下 next 按钮时不会发生这种情况,因为这样可以通过AJAX加载页面内容。这是单击下一步按钮时发出请求的示例:https://www.zalando.be/api/catalog/articles?categories=kleding&limit=84&offset=36036&sort=popularity
我建议调查分页逻辑是否存在某些可能触发重定向的超出范围页面请求保护的条件。
答案 1 :(得分:0)
我错了。
似乎几次重新加载页面时,内容都会改变。当浏览器转到www.zalando.be/kleding/?p=430时,浏览器还会收到302代码,这意味着服务器端存在动态内容的“问题”。我不知道Zalando是如何工作的,但我最大的猜测是人气排序会导致系统崩溃。当系统不知道正确的条目数量时,它将重定向到第429页(由431证明也是重定向的)。
这可能是一个非常临时的重定向,因为我无法重现该问题。