我正在尝试使用Perl XML :: LibXML :: reader 模块解析xml文档。 该模块运行良好,我能够解析大部分文档,但有一些关于xml的部分可能有多个元素在不同的级别上具有相同的名称,我不知道如何配置和处理这些元素,< / p>
我要做的是将下面的strcutre转换为对话的perl数据结构我尝试使用 XML :: Simple 和 XML :: Twig smplify子例程(如下所示)除了XML :: LibXML之外,用它们解析这一部分非常慢(比没有它们解析文档慢20倍),
my @conf= eval{($copy->findnodes('criteria'))};
my $t= XML::Twig->new();
my $hash=$t->parse($_->toString)->simplify(forcearray =>1 ]);
$t->purge();
有人可能会建议我如何解析下面的部分,以更快的方式使用XML :: LibXML :: reader来控制perl数据结构。 任何帮助,不胜感激
example of such file :
<criteria operator="OR">
<criteria operator="AND"> -> nested element
<criterion test_ref="oval:org.mitre.oval:tst:123" comment="Windows XP is installed"/>
<criterion test_ref="oval:org.mitre.oval:tst:234" comment="file foo.txt exists"/>
<criteria operator="OR"> -> nested element
<criterion test_ref="oval:org.mitre.oval:tst:127" comment="file x.txt exists"/>
<criterion test_ref="oval:org.mitre.oval:tst:127" comment="file y.txt exists"/>
</criteria>
</criteria>
<criteria operator="AND" negate="true"> ->nested element
<criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
<criterion test_ref="oval:org.mitre.oval:tst:456" comment="file fred.txt has a version less than 2"/>
<criterion test_ref="oval:org.mitre.oval:tst:567" negate="true" comment=patch is installed"/>
</criteria>
<criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
</criteria>
答案 0 :(得分:0)
我不确定你想要simplify
你的XML。看一下,你正在寻找的工具是XML::Twig
中的树枝处理程序。
例如:
#!/usr/bin/perl
use strict;
use warnings;
use XML::Twig;
use Data::Dumper;
my $xml = q{ <criteria operator="OR">
<criteria operator="AND"> -> nested element
<criterion test_ref="oval:org.mitre.oval:tst:123" comment="Windows XP is installed"/>
<criterion test_ref="oval:org.mitre.oval:tst:234" comment="file foo.txt exists"/>
<criteria operator="OR"> -> nested element
<criterion test_ref="oval:org.mitre.oval:tst:127" comment="file x.txt exists"/>
<criterion test_ref="oval:org.mitre.oval:tst:127" comment="file y.txt exists"/>
</criteria>
</criteria>
<criteria operator="AND" negate="true"> ->nested element
<criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
<criterion test_ref="oval:org.mitre.oval:tst:456" comment="file fred.txt has a version less than 2"/>
<criterion test_ref="oval:org.mitre.oval:tst:567" negate="true" comment="patch is installed"/>
</criteria>
<criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
</criteria> };
my %test_hash;
sub process_criteria {
my ( $twig, $criteria ) = @_;
foreach my $criterion ( $criteria->children('criterion') ) {
my $ref = $criterion->att('test_ref');
my $comment = $criterion->att('comment');
$test_hash{$ref} = $comment;
}
}
my $twig =
XML::Twig->new( twig_handlers => { criteria => \&process_criteria } )
->parse($xml);
print Dumper \%test_hash;
现在,我不确定这是否符合您的要求,但更多的是说明如何处理问题。