mechanize的Browser
类很棒,而且follow_link()函数也很棒。但是如何处理这种链接:
<a href="http://example.com"><img src="…"></a>
有没有办法关注此类链接?此类链接的text
属性只是'[IMG]'
,因此AFAIK,无法区分此类链接。任何帮助将不胜感激。
答案 0 :(得分:5)
要关注此类链接,您需要将 nr 参数添加到 follow_link()方法。
试试这个:
import mechanize
br = mechanize.Browser()
br.open('http://www.systempuntoout.com')
for link in br.links():
print(link)
br.follow_link(text='[IMG]', nr=0)
print br
>>><Browser visiting http://www.systempuntoout.com/quiz>
br.back()
br.follow_link(text='[IMG]', nr=1)
>>><Browser visiting http://www.systempuntoout.com/about>