使用HTML::TreeBuilder
,使用命令$root->look_down(_tag => 'a')
我得到第一个锚。
(1)如何找到最后锚?
此外,我如何检查标签的内部内容,检查标签内部是否包含某些字符串?例如,
(2)如何在HTML内部找到包含“Hallo”或“hallo”的锚点?
(3)如何在HTML内部找到不包含“Hallo”或“hallo”的锚点?
答案 0 :(得分:2)
look_down()
函数返回找到的所有<a>
个标签的列表,因此只需使用索引访问它的最后一个元素,如:
my $last_a_tag = ($root->look_down(_tag => 'a'))[-1]
要搜索其文本,请使用content_list()
函数,该函数返回包含所有子文本元素的列表。然后使用map()
函数检查它是否包含任何文本,例如:
map { m/[Hh]allo/ } $last_a_tag->content_list;