有谁知道是否有一种简单的方法来记录网址重定向路径上的所有网址?
例如:url :( url 1)重定向到(url 2),重定向到(url 3)。
我想编写一个脚本,输入字符串(url 1)并返回(url 2)和(url 3)。
有没有一种简单的方法可以做到这一点(理想情况下不使用javascript)?
答案 0 :(得分:1)
在python中:
import requests
url = 'http://google.com'
r = requests.get(url)
urls = [e.url for e in r.history]+[r.url]
然后你得到:
>>>urls
[u'http://google.com', u'http://www.google.com/']
仅当重定向位于http层(30x范围)
时才有效答案 1 :(得分:0)
require 'net/http'
def redirect_tracker(url)
paths_array = [url]
code = nil
begin
response = Net::HTTP.start(URI.parse(url).host){|http| http.request Net::HTTP::Head.new(url) }
code = response.code.to_i
paths_array << url if url = response['location']
end while (301..303).include?(code)
return paths_array
end
redirect_tracker('http://google.com')
# => ["http://google.com/", "http://www.google.com/"]
答案 2 :(得分:0)
从LWP获得$response
,
my @request_uris;
while ($response) {
unshift @request_uris, $response->request->uri;
$response = $response->previous;
}