如果我在脚本本身硬编码链接,我有这个脚本。但是希望从csv文件中获取多个url,如果这些url有效,则需要逐个验证所有这些url_to_check。请帮忙。感谢
import httplib
from urlparse import urlparse
def checkUrl(url):
p = urlparse(url)
conn = httplib.HTTPConnection(p.netloc)
conn.request('HEAD', p.path)
resp = conn.getresponse()
return resp.status < 400
if __name__ == '__main__':
print checkUrl('http://www.stackoverflow.com')
答案 0 :(得分:1)
您可以使用python的csv
模块来解析您的csv文件。
使用示例列名和checkUrl
函数的简单示例:
import csv
with open('/path/to/your/csv/file') as fobj:
reader = csv.DictReader(fobj)
for row in reader:
valid = checkUrl(row['url_to_check'])
print('%s is %svalid' % (row['url_to_check'], '' if valid else 'in'))