如何从页面中提取所有链接,不包括使用Perl的WWW :: Mechanize?

时间:2010-03-26 12:06:16

标签: perl www-mechanize

我正在尝试使用WWW::Mechanize使用find_all_links()方法从HTML页面中提取一些链接。它支持这些标准的匹配:

  • text
  • text_regex
  • url
  • url_regex
  • url_abs
  • url_abs_regex
    ...

如何提取所有之外的所有文字的链接?

2 个答案:

答案 0 :(得分:6)

您可以使用'text_regex'条件:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

有关负面预测断言的更多信息,请参阅perldoc perlre

答案 1 :(得分:1)

为什么不获取所有链接然后使用'grep'跳过那些你不需要的链接?