我也是编程和学习Perl的新手。
以下是我的问题:如何使用Perl模块解析Perl中的数据?
<h4>This is the line</h4>
abc : 130.65 TB<br>
dif : 74.52 TB<br>
asw : 56.13 TB<br>
qwe : 57<br>
这是来自网页的示例数据,我想要输出
abc = 130.65 TB
dif = 74.52 TB
asw = 56.13 TB
qwe = 57
有人可以帮助我吗?
答案 0 :(得分:5)
使用HTML解析模块,例如HTML::Parser或HTML::TreeBuilder。
如果您只想提取文本并删除所有标记,那么它应该如下所示:
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new();
$tree->parse( $YOUR_HTML_TEXT );
$tree->eof();
my $just_the_text = $tree->as_text();
$tree->delete;
您还可以查看http://htmlparsing.com/perl.html以了解有关使用Perl解析HTML的更多信息。
答案 1 :(得分:1)
您也可以使用HTML :: Tokeparser。但如果您更喜欢使用DOM模型,请尝试使用Mojo :: DOM