在Perl中按名称或ID解析一个特定的HTML标记?

时间:2010-07-08 20:41:12

标签: html perl parsing

这对我来说很难找到信息,我很幸运能得到一个答案我正试图做的与此相关的事情(下面的代码)..所以说我使用的是$ content输入(实际上它将是一个完整的HTML页面,而不仅仅是我在下面给出的代码段),我想获得名称或ID为“hush_username”的输入标记的内容。它现在的方式是它给出了所有输入标签的内容..我在这上面找到的唯一一件事就是提到这样的内容:

$tag->[1]{name} and $tag->[1]{name} eq "hush_username" ;

但是我无法让这个工作......我非常感谢任何建议

#!/usr/bin/perl
use strict; use warnings;
use HTML::TokeParser::Simple;
$content = do { local $/; <DATA> };            
my $parser = HTML::TokeParser::Simple->new(\$content);

while ( my $tag = $parser->get_tag('input') ) {
    print $tag->as_is, "\n";
    print "####" ;
    for my $attr ( qw( type name value ) ) {
        printf qq{%s="%s"\n}, $attr, $tag->get_attr($attr);
    }
}
__DATA__
<form name="authenticationform" id="authenticationform"
    action="/authentication/login?skin=mobile&next_webapp_name=hushmail5&amp;next_webapp_url_name=m" method="post">
<input type="hidden" name="next_webapp_page" value=""/>
<p><label for="hush_username">Email address:</label><br/>
<input type="email" name="hush_username" id="hush_username" value="email@test.com"/></p>
<p><label for="hush_passphrase">Passphrase:</label><br/>
<input type="password" name="hush_passphrase" id="hush_passphrase"  maxlength="1000" value=""/></p>
<p><input type="checkbox" name="hush_remember_me" id="hush_remember_me" value="on"
/><label for="hush_remember_me">Stay signed in when I close my browser</label></p>
<p><input type="submit" value="Sign In"/></p>
<input type="hidden" name="hush_customerid" value="0000000000000000"/>
</form>

1 个答案:

答案 0 :(得分:4)

保持简单。怎么样?

while ( my $tag = $parser->get_tag('input') ) {
  my $name = $tag->get_attr('name');
  next unless defined $name and $name eq 'hush_username';
  print "Value: ", $tag->get_attr('value'), "\n";
}