Python机械化在第二次打开时丢失属性

时间:2009-12-04 11:47:21

标签: python mechanize

这是一个非常专业的案例,我觉得很尴尬;但是,我正在努力工作。

我需要通过表单和结果页面跟踪跟踪号码,所以我一直在python中使用mechanize,表单提交后的链接嵌入在javascript中,所以我不能简单地跟随链接。我想要做的是重新编写网址,然后打电话给open(),但是当我这样做时 - 我遇到了一些问题。

我可以在目标页面上调用br.geturl()br.title(),但是当需要阅读相关页面的来源时,它会抛出

AttributeError: mechanize._mechanize.Browser instance has no attribute read (perhaps you forgot to .select_form()?)

是否有某种方法可以做到这一点,或者我在修补它太多了,任何建议都会很棒

编辑[更多代码{真的很丑,只是试图让它工作}]:

cosn="########"
baseurl="http://aaa.com/"
search="thing.do"

br=Browser()
br.open(baseurl+search)
br.select_form('traceForm')
br['consignments']=cosn
req=br.submit()
pars=Soup(req.read())
found_url=re.match(r"javascript:window.location.href = '(?P<url>[\w\d=&?\.]+)", pars.find('td', attrs={'class':'select'})['onclick']).group('url')

br.open(baseurl+found_url)
print br.title()  # works
print br.geturl()  # works
print br.read()  # throws exception

1 个答案:

答案 0 :(得分:7)

您永远不会在浏览器实例上进行第一次 .read方法调用。那是因为它没有这样的方法。 Browswer.response具有read方法,因此如果您想获得响应主体,则需要执行此操作:

response = br.response()
response.read()

将来,您可以使用dir(obj)查看对象obj的内容,无论是浏览器还是其他任何内容。