如何编写一个python程序,从文本文件中读取短URL列表,扩展它们,然后将它们转储到另一个文件中?
我需要为每个链接找到最新的重定向(返回" 200 OK")并且不知道从哪里开始。
答案 0 :(得分:0)
您可以使用requests
模块解析网址重定向:
import requests
url = '...'
response = requests.head(url)
if response.is_redirect:
print(response.headers['Location'])
答案 1 :(得分:0)
执行此操作的一种方法是使用Mechanize库:
import mechanize
br = mechanize.Browser()
br.set_handle_robots(False)
fLong = open("longURL.txt", 'w')
with open("shortURL.txt",'r') as fShort:
for url in fShort:
br.open(url)
fLong.write(br.geturl() + '\n')
fLong.close()