如何使用WWW :: Mechanize :: Firefox选择没有类或ID的特定HTML元素?

时间:2013-03-11 11:34:32

标签: perl web-scraping www-mechanize www-mechanize-firefox

我正在尝试遍历页面上的链接,但我只想循环浏览特定的链接。问题是<a>锚中的链接根本没有CSS ID或类。

例如

<a title="View More Information on FOO" href="tranlist.phtml?scode=FOO&sname=&refpg=1&snapcode=&ssector=1123&scheme=default" name="tranlist">

唯一唯一的是name,但似乎不能用CSS选择器指定。

2 个答案:

答案 0 :(得分:2)

来自module documentation

$mech->find_link(name => "something")

name_containsname_regex也可用。

[编辑:find_link_dom返回特定于Firefox的MozRepl::RemoteObject::Instance个对象,而不是WWW::Mechanize::Link返回的标准find_link对象。修订了更通用的案例。]

答案 1 :(得分:2)

CSS specification开始,a.normal之类的CSS选择器与a[class~=normal]相同,您可以通过该方式匹配任何属性。所以你需要

$mech->selector('a[name=tranlist]')