Perl HTML:TreeBuilder标签不等于

时间:2014-09-13 15:22:14

标签: regex perl html-treebuilder

我正在使用HTML::TreeBuilder来从html文件中提取数据。我需要做的是:

$div->look_down(_tag => 'a', 'href' !=> 'index.html')

所以我正在寻找一个不等于' index.html'的href。和另外一个标签,但显然!=>不是HTML::TreeBuilder的正确命令。 我怎样才能实现这样的目标?我可以使用正则表达式吗?

BR

1 个答案:

答案 0 :(得分:2)

没有“不相等”,但您可以使用匹配除该字符串之外的任何内容的正则表达式,例如

$div->look_down( _tag => 'a', href => qr/\A(?!index\.html\z)/i )

或者您可以编写一个进行检查的子程序

$div->look_down( _tag => 'a', sub { lc $_[0]->attr('href') ne 'index.html' } )