转换短网址

时间:2013-02-19 16:02:46

标签: python web web-scraping

两天的新手Python(和编程)所以请温柔。

我从Twitter上删除了大约1500个缩短的网址。它们都采用以下格式:http://t.co/ ...

使用它来扩展短网址:

import urllib2  
a = urllib2.urlopen('http://t.co/..')  
print a.url

最后两行用不同的URL重复了大约1500次不同的时间。

只要URL指向的页面存在,它就可以正常工作,但是当它不存在时会出现错误消息并且在此时停止。我将如何添加到代码中以便返回“找不到页面”并继续到下一个URL并完整地浏览整个列表。

1 个答案:

答案 0 :(得分:2)

假设你正在使用python 2(python 3稍微有其他语法用于异常处理)

for url in urls:
    try:
        a = urllib2.urlopen(url)  
    except urllib2.HTTPError, e:
        print "Error", e
        continue

..... do something with a