用perl创建的数据库存储为xml

时间:2011-07-02 17:07:34

标签: xml perl data-structures

我正在尝试将复杂的数组/哈希结构保存到xml。 由于我是perl和xml的新手,我不知道最简单的方法是什么。

所有xml解析器,编写器,libxml等模块都没有给我我想要的东西。 例如。 DumpXML添加了很多标签。我尝试了很多不同的模块,但它们似乎都没有做我想要的,或者我不知道如何设置它们以便它们按照我的要求工作。 也许我必须在较低级别编写xml部分? 或者,如果我不使用perl数据结构但是直接将它存储到xml中,那么它可能是最好的吗?

这个想法是从xml数据创建一个php网页。 不幸的是我也是一个PHP菜鸟,所以只是希望这样做不会是一个大问题。 :-) 我只想拥有xml文件的逻辑布局,如下例所示。

以下是我使用Data::DiverXML::Smart进行尝试的方式。

#!/usr/bin/perl
use strict;
use warnings;
use Data::Dumper;
use Data::Diver qw( Dive DiveRef DiveVal DiveError );
use XML::Smart;

my $content = {};

# Usage: add_content_entry(name, group, descr)
sub add_content_entry {
  my $name   = shift;
  my $group  = shift;
  my $descr1 = shift;
  my $descr2 = shift;

  my $data = {
    DESCR1 => $descr1,
    DESCR2 => $descr2,
  };

  my @pos = split('/', $group);
  push @pos, $name;
  DiveVal( $content, @pos ) = $data;
}

sub xml_read {
  my $xml = XML::Smart->new('file.xml');
  $content = $xml->data;
}

sub xml_write {
  my $xml = XML::Smart->new(
    q`
      <?xml version="1.0" encoding="iso-8859-1" ?>
      <content></content>
    `);
  $xml->{content} = $content;
  $xml->('file.xml');
}

# Main
&xml_read;  # file.xml is empty

&add_content_entry( 'content.1', 'group.A', 'Hello', 'World' );
&add_content_entry( 'content.2', 'group.B/group.x', 'Fred', 'Flintstone' );
&add_content_entry( 'content.3', 'group.B/group.y', 'bla', 'blah' );
&add_content_entry( 'content.4', 'group.B/group.y', '???', '!!!' );
&add_content_entry( 'content.5', 'group.C/group.z', '...', '...' );

&xml_write; # file.xml is written
$content = {};
&xml_read;  # justify that file.xml can be read
print Dumper $content;

输出应为:

$VAR1 = {
          'group.A' => {
                         'content.1' => {
                                          'DESCR2' => 'World',
                                          'DESCR1' => 'Hello'
                                        }
                       },
          'group.C' => {
                         'group.z' => {
                                        'content.5' => {
                                                         'DESCR2' => '...',
                                                         'DESCR1' => '...'
                                                       }
                                      }
                       },
          'group.B' => {
                         'group.y' => {
                                        'content.3' => {
                                                         'DESCR2' => 'blah',
                                                         'DESCR1' => 'bla'
                                                       },
                                        'content.4' => {
                                                         'DESCR2' => '!!!',
                                                         'DESCR1' => '???'
                                                       }
                                      },
                         'group.x' => {
                                        'content.2' => {
                                                         'DESCR2' => 'Flintstone',
                                                         'DESCR1' => 'Fred'
                                                       }
                                      }
                       }
        };

我的问题是不同内容的等级数量不同。

在xml文件中应该有类似的东西(我知道排序是任意的。我保持与print Dumper的输出相同)。

<?xml version="1.0" encoding="iso-8859-1" ?>
<content>
  <group.A>
    <content.1>
      <DESCR2>World</DESCR>
      <DESCR1>Hello</DESCR1>
    </content.1>
  </group.A>
  <group.C>
    <group.z>
      <content.5>
        <DESCR2>...</DESCR>
        <DESCR1>...</DESCR1>
      </content.5>
    </group.z>
  </group.C>
  <group.B>
    <group.y>
      <content.3>
        <DESCR2>blah</DESCR>
        <DESCR1>bla</DESCR1>
      </content.3>
      <content.4>
        <DESCR2>!!!</DESCR>
        <DESCR1>???</DESCR1>
      </content.4>
    </group.y>
    <group.x>
      <content.2>
        <DESCR2>Flintstone</DESCR>
        <DESCR1>Fred</DESCR1>
      </content.2>
    </group.x>
  </group.B>
</content>

<?xml version="1.0" encoding="iso-8859-1" ?>
<content>
  <group.A>
    <content DESCR2="World" DESCR1="Hello">content.1</content>
  </group.A>
  <group.C>
    <group.z>
      <content DESCR2="..." DESCR1="...">content.5</content>
    </group.z>
  </group.C>
  <group.B>
    <group.y>
      <content DESCR2="blah" DESCR1="bla">content.3</content>
      <content DESCR2="!!!" DESCR1="???">content.4</content>
    </group.y>
    <group.x>
      <content DESCR2="Flintstone" DESCR1="Fred">content.2</content>
    </group.x>
  </group.B>
</content>

2 个答案:

答案 0 :(得分:1)

您应该查看DBD::AnyData,看看它是否符合您的需求。它支持使用与SQL数据库相同的XML文件。

答案 1 :(得分:1)

我建议你考虑使用YAML作为XML的替代品。正如您所说,XML倾向于使用标签变得臃肿。 YAML输出更清晰,设计为人们可读。

因此,您的数据输出可能如下所示:

  group.A:
    content.1:
     - DESCR2: World
     - DESCR1: Hello
  group.C:
    group.z:
      content.5:
       - DESCR2: ...
       - DESCR1: ...
  group.B:
   - group.y:
     - content.3:
       - DESCR2: blah
       - DESCR1: bla
     - content.4:
       - DESCR2: !!!
       - DESCR1: ???
   - group.x:
      content.2:
       - DESCR2: Flintstone
       - DESCR1: Fred

在Perl中,您可以使用YAML :: XS模块。有些PHP模块也能识别YAML。