xml在不同级别上的相同标记名称

时间:2013-12-31 17:59:40

标签: xml perl xml-libxml

我正在尝试使用Perl XML :: LibXML :: reader 模块解析xml文档。 该模块运行良好,我能够解析大部分文档,但有一些关于xml的部分可能有多个元素在不同的级别上具有相同的名称,我不知道如何配置和处理这些元素,< / p>

我要做的是将下面的strcutre转换为对话的perl数据结构我尝试使用 XML :: Simple XML :: Twig smplify子例程(如下所示)除了XML :: LibXML之外,用它们解析这一部分非常慢(比没有它们解析文档慢20倍),

 my @conf= eval{($copy->findnodes('criteria'))};
 my $t= XML::Twig->new();
  my $hash=$t->parse($_->toString)->simplify(forcearray =>1  ]);
  $t->purge();

有人可能会建议我如何解析下面的部分,以更快的方式使用XML :: LibXML :: reader来控制perl数据结构。 任何帮助,不胜感激

 example of such file :

 <criteria operator="OR">

    <criteria operator="AND">  -> nested element
    <criterion test_ref="oval:org.mitre.oval:tst:123" comment="Windows XP is installed"/>
    <criterion test_ref="oval:org.mitre.oval:tst:234" comment="file foo.txt exists"/>
    <criteria operator="OR"> -> nested element
    <criterion test_ref="oval:org.mitre.oval:tst:127" comment="file x.txt exists"/>
    <criterion test_ref="oval:org.mitre.oval:tst:127" comment="file y.txt exists"/>
    </criteria> 
     </criteria> 
    <criteria operator="AND" negate="true"> ->nested element
    <criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
    <criterion test_ref="oval:org.mitre.oval:tst:456" comment="file fred.txt has a version less than 2"/>
    <criterion test_ref="oval:org.mitre.oval:tst:567" negate="true" comment=patch is installed"/>
    </criteria>
    <criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
 </criteria>

1 个答案:

答案 0 :(得分:0)

我不确定你想要simplify你的XML。看一下,你正在寻找的工具是XML::Twig中的树枝处理程序。

例如:

#!/usr/bin/perl

use strict;
use warnings;
use XML::Twig;
use Data::Dumper;

my $xml = q{ <criteria operator="OR">

    <criteria operator="AND">  -> nested element
    <criterion test_ref="oval:org.mitre.oval:tst:123" comment="Windows XP is installed"/>
    <criterion test_ref="oval:org.mitre.oval:tst:234" comment="file foo.txt exists"/>
    <criteria operator="OR"> -> nested element
    <criterion test_ref="oval:org.mitre.oval:tst:127" comment="file x.txt exists"/>
    <criterion test_ref="oval:org.mitre.oval:tst:127" comment="file y.txt exists"/>
    </criteria> 
     </criteria> 
    <criteria operator="AND" negate="true"> ->nested element
    <criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
    <criterion test_ref="oval:org.mitre.oval:tst:456" comment="file fred.txt has a version less than 2"/>
    <criterion test_ref="oval:org.mitre.oval:tst:567" negate="true" comment="patch is installed"/>
    </criteria>
    <criterion test_ref="oval:org.mitre.oval:tst:345" comment="Windows 2003 is installed"/>
 </criteria> };

my %test_hash;

sub process_criteria {
    my ( $twig, $criteria ) = @_;
    foreach my $criterion ( $criteria->children('criterion') ) {
        my $ref     = $criterion->att('test_ref');
        my $comment = $criterion->att('comment');
        $test_hash{$ref} = $comment;
    }
}

my $twig =
    XML::Twig->new( twig_handlers => { criteria => \&process_criteria } )
    ->parse($xml);

print Dumper \%test_hash;

现在,我不确定这是否符合您的要求,但更多的是说明如何处理问题。