检查(内部HTML)内容的look_down

时间:2014-01-12 15:32:26

标签: perl

使用HTML::TreeBuilder,使用命令$root->look_down(_tag => 'a')我得到第一个锚。

(1)如何找到最后锚?

此外,我如何检查标签的内部内容,检查标签内部是否包含某些字符串?例如,

(2)如何在HTML内部找到包含“Hallo”“hallo”的锚点?

(3)如何在HTML内部找到包含“Hallo”“hallo”的锚点?

1 个答案:

答案 0 :(得分:2)

look_down()函数返回找到的所有<a>个标签的列表,因此只需使用索引访问它的最后一个元素,如:

my $last_a_tag = ($root->look_down(_tag => 'a'))[-1]

要搜索其文本,请使用content_list()函数,该函数返回包含所有子文本元素的列表。然后使用map()函数检查它是否包含任何文本,例如:

map { m/[Hh]allo/ } $last_a_tag->content_list;