Python:网址扩展程序

时间:2017-02-23 15:06:56

标签: python

如何编写一个python程序,从文本文件中读取短URL列表,扩展它们,然后将它们转储到另一个文件中?

我需要为每个链接找到最新的重定向(返回" 200 OK")并且不知道从哪里开始。

2 个答案:

答案 0 :(得分:0)

您可以使用requests模块解析网址重定向:

import requests

url = '...'
response = requests.head(url)
if response.is_redirect:
    print(response.headers['Location'])

答案 1 :(得分:0)

执行此操作的一种方法是使用Mechanize库:

import mechanize

br = mechanize.Browser()
br.set_handle_robots(False)

fLong = open("longURL.txt", 'w')

with open("shortURL.txt",'r') as fShort:
    for url in fShort:
        br.open(url)
        fLong.write(br.geturl() + '\n')

fLong.close()