Perl HTML解析器

时间:2011-10-30 13:05:03

标签: perl web-scraping

我在解析HTML文件时遇到了一些困难。

以下是我要提取网站名称的HTML文件部分:

  

<span class="bold1">Name: </span>www.google.com<br />

     

<span class="bold1">Name: </span>www.facebook.com<br />

     

<span class="bold1">Name: </span>www.myspace.com<br />

以下是使用HTML::TreeBuilder模块

的Perl代码段
my @style = $root->look_down('class' => qr/bold1$/);

我们如何在这里提取下一个元素:我想从上面的例子中提取:

  1. www.google.com
  2. www.facebook.com
  3. www.myspace.com
  4. for (@style) 
    {
       my $title1 = $_->as_HTML; #text
       print " title" . $title .  "\n";
    }
    

    由于

1 个答案:

答案 0 :(得分:3)

使用right()方法。