我是XML::Twig的新手。如何更改所有空元素以使用空元素标记(<foo/>
)而不是开始标记和结束标记组合(<foo></foo>
)?
输入:
<book>
<given-names>Maurice<xref ref-type="fn" rid="fnI_1"></xref></given-names>
<colspec colname="col1" colnum="1"></colspec>
<entry align="left"><p></p></entry>
</book>
我需要输出为:
<book>
<given-names>Maurice<xref ref-type="fn" rid="fnI_1"/></given-names>
<colspec colname="col1" colnum="1"/>
<entry align="left"><p/></entry>
</book>
我试过了:
use XML::Twig;
my $xml = XML::Twig->new(twig_handlers => {
'xref' => sub {$_->set_tag('#EMPTY'),},
},
pretty_print => 'indented',
);
$xml->parse('sample.xml');
$xml->print;
}
但我无法处理它。如何在没有内容标签的情况下全面改变空标签?我该怎么改变?
答案 0 :(得分:5)
XML :: LibXML将自动输出更短的版本。
use XML::LibXML qw( );
print XML::LibXML->new()->parse_file($ARGV[0])->toString();
对于XML :: Twig,默认情况下它也使用较短的形式(empty_tags => 'normal'
)。但是,它只考虑从<foo/>
创建的空元素。 (对我来说似乎很蠢!)我做了一些挖掘,发现如果它认为元素是空的,它确实允许你改变。这是使用set_empty
和set_not_empty
完成的。
use XML::Twig qw( );
my $twig = XML::Twig->new(
twig_handlers => {
'*' => sub {
$_->set_empty() if !$_->first_child();
},
},
);
$twig->parsefile($ARGV[0]);
$twig->print();
答案 1 :(得分:2)
如果你想坚持使用Twig,你可以这样做:
#!usr/bin/perl
use strict;
use warnings;
use XML::Twig;
my $xml = XML::Twig->new(twig_handlers => {
'p' => sub {
if (!$_->first_child()) { $_->set_content('#EMPTY') }
},
},
pretty_print => 'indented',
empty_tags => 'normal'
);
$xml->parsefile('file.xml');
$xml->print;
基本上你必须手动检查元素是否包含任何内容,然后将其设置为空元素。