我正在尝试通过python脚本从互联网上下载文件。我正在使用“机械化”模块来访问网络,但是当我尝试关注链接时,由于网页采用lxml格式,因此会出现html读取错误。我的代码如下:
import mechanize
br = mechanize.Browser()
br.set_handle_robots(False)
br.open("ftp://ftp.ncdc.noaa.gov/pub/data/ghcn/v2/")
接下来我通常会做以下事情:
request = br.retrieve('link.zip')[0]
然而,这会产生提到的html错误。有人可以帮帮我吗?