如何在Perl中使用id删除html标签?

时间:2010-12-15 10:37:26

标签: perl

这里的任何人都知道如何在使用XML :: Simple输出时用Perl去除html标签吗?

这是我的代码;

#!/usr/bin/perl
use XML::Simple;
$xml = new XML::Simple;
$data = $xml->XMLin('library.xml', ForceArray => 1, KeyAttr => {},);

foreach my $library (@{$data->{library}})
{
  foreach my $shelf (@{$library->{shelf}})
  {
    print $xml->XMLout($shelf, RootName => "book", NoSort => 1);
  }
}

此代码将输出类似的内容;

<library>
  <book shelf="12345">Book Title Here</book>
</library>

如何删除标签,并保留标题。也许还有更好的方法,请告诉我。

任何帮助将不胜感激:-)谢谢。

1 个答案:

答案 0 :(得分:1)

如果您没有在XML :: Simple中找到任何内容,为什么不删除标签?

    local $_ = $xml->XMLout($shelf, RootName => "book", NoSort => 1);
    s#<.+?>#\n#sg;
    s#\s*\n+\s*#\n#sg;
    print;