使用Mechanize进行ASPX抓取:无法检索表单?

时间:2012-05-10 13:33:03

标签: python screen-scraping web-scraping mechanize

我正在尝试使用Python Mechanize来抓取an .aspx web page。但即使我手动删除DTD,我仍然会收到一个有趣的ParseError: unexpected '[' char in declaration错误。

以下是我的完整代码:

url = 'http://corporate.marksandspencer.com/aboutus/where/international_stores'
browser = mechanize.Browser()
browser.open(url)
browser.select_form(nr=0)

在最后一行失败,ParseError: unexpected '[' char in declaration。任何人都可以建议可能出现的问题吗?

1 个答案:

答案 0 :(得分:6)

我也有类似的问题。我在开始时添加了以下行,它对我有用。

self.browser = mechanize.Browser(factory=mechanize.RobustFactory())