我正在使用HTML::TreeBuilder
来从html文件中提取数据。我需要做的是:
$div->look_down(_tag => 'a', 'href' !=> 'index.html')
所以我正在寻找一个不等于' index.html'的href。和另外一个标签,但显然!=>
不是HTML::TreeBuilder
的正确命令。
我怎样才能实现这样的目标?我可以使用正则表达式吗?
BR
答案 0 :(得分:2)
没有“不相等”,但您可以使用匹配除该字符串之外的任何内容的正则表达式,例如
$div->look_down( _tag => 'a', href => qr/\A(?!index\.html\z)/i )
或者您可以编写一个进行检查的子程序
$div->look_down( _tag => 'a', sub { lc $_[0]->attr('href') ne 'index.html' } )