我想知道是否有一种方法可以从网页下载附件,而这些网页没有使用beautifulsoup或其他Python模块(mechanize,urllib2)显式链接到它?
例如,在以下网站中 http://www.transtats.bts.gov/DL_SelectFields.asp?Table_ID=236, 我们需要先选择一些选项,然后点击下载按钮下载文件。
答案 0 :(得分:0)
这听起来像是Selenium(用于通过代码控制浏览器的软件包)的工作。
答案 1 :(得分:0)
下载按钮很可能是提交带有一些表单数据的帖子请求,并将结果作为下载提供给您。尝试使用python请求库提交表单并处理下载。