我想使用Urlretrieve从页面下载txt文件。 然而它的韵律运作良好,但大部分时间只是下载了不可读的文本。
以下是我的代码和网站:
import urllib
import os,sys
opener = urllib.request.build_opener()
opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')]
urllib.request.install_opener(opener)
url='http://www.17500.cn/getData/ssq.TXT'
try:
urllib.request.urlretrieve(url, os.getcwd()+'/data/data - all.txt')
except urllib.error.HTTPError as e:
print('failure')
但是,如果我打开数据 - all.tex,我明白了? Yķ堽??ř逆a{PU类,憕7个?????????翰*嬊荪傛0 @瑫襅威J鸰迭怔W¯¯踎m邒纯 я?锖束+鳢^祸读?茔?頬