使用LibXML验证XML

时间:2010-09-05 15:59:32

标签: xml perl validation libxml2

目前,我使用XML :: LibXML perl模块根据定义的XML模式验证XML文件。目前,如果我的XML文件无法针对定义的XML Schema成功验证,我将得到一个错误列表通知我,例如某些元素不是预期的,然后是预期的。在我的XML文件中,我将有许多相同名称的元素,但它们可能嵌套在XML文件的不同位置。

我的问题是,无论如何我可以输出尝试执行验证时可能出错的任何元素的XPath位置吗?

目前,我的XML文件很大,并且在验证失败时很难“调试”它,因为错误中显示的元素名称可能会在XML文件的不同位置多次出现。

我的代码如下所示,使用LibXML根据模式验证XML文件。

#!/usr/bin/perl
use strict;
use warnings;
use XML::LibXML;

my $schema_file = 'MySchema.xml';
my $document    = 'MyFile.xml';

my $schema = XML::LibXML::Schema->new(location => $schema_file);

my $parser = XML::LibXML->new;
my $doc    = $parser->parse_file($document);

eval { $schema->validate($doc) };
die $@ if $@;

print "$document validated successfully\n";

3 个答案:

答案 0 :(得分:3)

我偶然发现了同样的问题,发现XML解析器默认不存储行号 。但是您可以使用构造函数的XML_LIBXML_LINENUMBERS参数告诉他这样做。

以下脚本会告诉实际行号而不是0

use Modern::Perl;
use XML::LibXML;

my ($instance, $schema) = @ARGV;

my $doc = XML::LibXML->new(XML_LIBXML_LINENUMBERS => 1)->parse_file($instance); 
my $xmlschema = XML::LibXML::Schema->new( location => $schema );
my $res = eval { $xmlschema->validate( $doc ); };

say "error: $@" if $@;
say "res: ", $res//'undef';

答案 1 :(得分:2)

您可能需要查看:XML::Validate以获取行号和列号?

答案 2 :(得分:0)

参见Padre::Task::SyntaxChecker::XML的来源。 Padre IDE使用此模块对XML文件进行语法检查。另请参阅Padre-Plugin-XML发行版中的t / 01-valid.t以获取包含行号的用法示例。