我使用哪个模块来获取HTML元素的内容?

时间:2012-06-15 18:44:04

标签: perl web-scraping

我有一个Internet浏览器导航到一个页面,我能够在一个数组中获取该页面。我想要做的是获取div文件的内容,例如页面返回

<div class="someClass">Text in div</div> 

我希望得到那个文字,我该怎么做?我在考虑尝试

->content("someClass");

但它不起作用。

1 个答案:

答案 0 :(得分:2)

使用Web::Query

use Web::Query qw();
use WWW::Mechanize qw();
my $mech = WWW::Mechanize->new;
$mech->get('file:///tmp/so11056483.html');
Web::Query
    ->new_from_html($mech->content)
    ->find('div.someClass')
    ->text

表达式返回字符串Text in div