使用Perl刮取HTML文件,仅按顺序返回内容

时间:2015-09-02 19:34:56

标签: perl mojolicious html-tree html-treebuilder mojo-dom

使用HTML :: TreeBuilder - 或Mojo :: DOM - 我想抓取内容但保持顺序,以便我可以将文本值放入数组中(然后用文本值替换用于模板目的的变量)

但是在TreeBuilder中

my $map_r = $tree->tagname_map();

my @contents = map { $_->content_list } $tree->find_by_tag_name(keys %$map_r);

foreach my $c (@contents) {
  say $c;
}

不返回订单 - 当然没有订购哈希。那么,如何从root访问树并保持返回的值序列?递归地走树?基本上,我想使用'as_text'方法,除了每个元素。 (遵循这个nice idea,但我需要所有元素)

0 个答案:

没有答案