我在使用此代码时遇到了一些问题:
my $file= '../xml/news.xml';
my $parser= XML::LibXML->new();
my $doc = $parser->parse_file($file);
my $xpc = XML::LibXML::XPathContext->new($doc);
my $query = '/notizie/news[@id='.$newsId.']';
print $query;
my $node = $xpc->findnodes($query)->get_node(1);
print $node;
特别是" print $ node"即使XML文件路径正确且XPath查询应返回节点,也会打印一个空字符串。
"搞笑"事情是,如果我使用:
my $query = '/*/*[@id='.$newsId.']';
我得到了正确的结果。
这是news.xml文件:
<?xml version="1.0"?>
<notizie xmlns="http://www.9armonie.com/news"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.9armonie.com/news news.xsd">
<news id="3">
<data>2015-01-01</data>
<ora>12:00:00</ora>
<titolo>Title 3</titolo>
<descrizione> Description 3</descrizione>
</news>
<news id="2">
<data>2014-12-19</data>
<ora>12:00:00</ora>
<titolo>Title 2</titolo>
<descrizione> Description 2</descrizione>
</news>
<news id="1">
<data>2014-12-18</data>
<ora>12:00:00</ora>
<titolo>News 1</titolo>
<descrizione> Desc 1</descrizione>
</news>
<news id="0">
<data>2014-12-18</data>
<ora>12:00:00</ora>
<titolo> asdasd</titolo>
<descrizione> First! </descrizione>
</news>
</notizie>
答案 0 :(得分:2)
您的输入XML文档位于默认命名空间:
<notizie xmlns="http://www.9armonie.com/news"/>
此元素及其所有后代都在该命名空间中,而//notizie
之类的表达式永远不会成功,因为它会查找没有命名空间的元素。
另一方面,这也是/*/*
返回元素的原因 - 因为*
匹配任何(或没有)命名空间中的元素。真的没什么好笑的。
在Perl代码中声明此命名空间(更好的选项),或忽略XPath表达式中的命名空间。
使用LibXML声明命名空间
我相信在LibXML中声明命名空间是使用registerNs()
完成的,请参阅relevant CPAN page。从输入XML声明名称空间URI以及前缀(在此示例中为news:
),然后您可以使用它来限定XPath表达式中的元素名称。
my $xpc = XML::LibXML::XPathContext->new($doc);
$xpc->registerNs('news', 'http://www.9armonie.com/news');
my $query = '/news:notizie/news:news[@id='.$newsId.']';
my $node = $xpc->findnodes($query)->get_node(1);
忽略名称空间
第二个选项意味着将XPath表达式修改为
"/*[local-name() = 'notizie']/*[local-name() = 'news' and @id='.$newsId.']"
上述表达式将在以下所有文档中找到notizie
元素:
<!--No namespace-->
<notizie/>
<!--Namespace with prefix-->
<news:notizie xmlns:news="http://www.9armonie.com/news"/>
<!--Default namespace-->
<notizie xmlns="http://www.9armonie.com/news"/>