Python网页抓取无法从此页面中找到表单

时间:2014-04-21 13:37:25

标签: python web-scraping mechanize

我希望使用看起来像表单的方式在页面底部循环日期。但它正在回归空白。这是我的代码。

import mechanize

URL='http://www.airchina.com.cn/www/jsp/airlines_operating_data/exlshow_en.jsp'

br = mechanize.Browser()
r=br.open(URL)

for form in br.forms(): #finding the name of the form
    print form.name
    print form

为什么这不会返回任何形式?它不是一种形式?如果没有,我如何控制底部的yearmonth来循环浏览页面?

有人可以提供一些示例代码吗?

1 个答案:

答案 0 :(得分:1)

尝试访问该页面时,您实际执行的操作将被定向到错误页面。将该网址粘贴到浏览器中,您将获得一个包含以下内容的页面:

Not comply with the conditions of the inquiry data

并且根本没有表格

您需要以不同的方式访问该页面。我建议单步执行url目录,直到找到正确的路径。