Python Mechanize中的错误 - “mechanize._mechanize.BrowserStateError:not viewing HTML”

时间:2010-08-12 05:18:23

标签: python mechanize

for link in br.links(url_regex="inquiry-results.jsp"):
    cb[link.url] = link

for page_link in cb.values():               
   for link in br.links(url_regex="inquiryDetail.jis"): 
            ....................
      url = link.absolute_url
      br.follow_link(link)
            ......................
   br.follow_link(page_link)

这是我的代码。基本上,它提取页面链接[第1,2,3,4,5页的链接...]和特定页面的数据链接。然后它进入每个数据链接并提取一些数据,完成后移动到下一页。但我总是得到这个错误:

Traceback (most recent call last):
  File "C:\python27\test.py", line 95, in <module>
    for link in br.links(url_regex="inquiryDetail.jis"):
  File "build\bdist.win32\egg\mechanize\_mechanize.py", line 405, in links
mechanize._mechanize.BrowserStateError: not viewing HTML

有人可以帮忙吗?

3 个答案:

答案 0 :(得分:6)

感谢loevborg发布的链接,我一直在使用它:

br.open('http://example.com')
br._factory.is_html = True

现在br.viewing_html()将评估为True

答案 1 :(得分:2)

这似乎与检查响应是否有效HTML有关:

http://github.com/jjlee/mechanize/blob/master/mechanize/_mechanize.py#L440

也许你得到XHTML的回复,或者标题无效?可能有某种方法可以覆盖is_html属性(例如here)。

答案 2 :(得分:0)

在br.open可能帮助您之前将您的应用作为浏览器介绍:

br.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/45.0.2454101')]