LibXML findnodes($ query)

时间:2015-01-28 21:54:40

标签: perl xpath libxml2

我在使用此代码时遇到了一些问题:

my $file= '../xml/news.xml';
my $parser= XML::LibXML->new();
my $doc = $parser->parse_file($file);
my $xpc = XML::LibXML::XPathContext->new($doc);
my $query = '/notizie/news[@id='.$newsId.']';
print $query;
my $node = $xpc->findnodes($query)->get_node(1);

print $node;

特别是" print $ node"即使XML文件路径正确且XPath查询应返回节点,也会打印一个空字符串。

"搞笑"事情是,如果我使用:

my $query = '/*/*[@id='.$newsId.']'; 

我得到了正确的结果。

这是news.xml文件:

<?xml version="1.0"?>
<notizie xmlns="http://www.9armonie.com/news"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.9armonie.com/news news.xsd">
    <news id="3">
        <data>2015-01-01</data>
        <ora>12:00:00</ora>
        <titolo>Title 3</titolo>
        <descrizione> Description 3</descrizione>
    </news>     
    <news id="2">
        <data>2014-12-19</data>
        <ora>12:00:00</ora>
        <titolo>Title 2</titolo>
        <descrizione> Description 2</descrizione>
    </news>
    <news id="1">
        <data>2014-12-18</data>
        <ora>12:00:00</ora>
        <titolo>News 1</titolo>
        <descrizione> Desc 1</descrizione>
    </news>
    <news id="0">
        <data>2014-12-18</data>
        <ora>12:00:00</ora>
        <titolo> asdasd</titolo>
        <descrizione> First! </descrizione>
    </news>
</notizie>

1 个答案:

答案 0 :(得分:2)

您的输入XML文档位于默认命名空间

<notizie xmlns="http://www.9armonie.com/news"/>

此元素及其所有后代都在该命名空间中,而//notizie之类的表达式永远不会成功,因为它会查找没有命名空间的元素。

另一方面,这也是/*/*返回元素的原因 - 因为*匹配任何(或没有)命名空间中的元素。真的没什么好笑的。

在Perl代码中声明此命名空间(更好的选项),或忽略XPath表达式中的命名空间。

使用LibXML声明命名空间

我相信在LibXML中声明命名空间是使用registerNs()完成的,请参阅relevant CPAN page。从输入XML声明名称空间URI以及前缀(在此示例中为news:),然后您可以使用它来限定XPath表达式中的元素名称。

my $xpc = XML::LibXML::XPathContext->new($doc);
$xpc->registerNs('news', 'http://www.9armonie.com/news');
my $query = '/news:notizie/news:news[@id='.$newsId.']';
my $node = $xpc->findnodes($query)->get_node(1);

忽略名称空间

第二个选项意味着将XPath表达式修改为

"/*[local-name() = 'notizie']/*[local-name() = 'news' and @id='.$newsId.']"

上述表达式将在以下所有文档中找到notizie元素:

<!--No namespace-->
<notizie/>

<!--Namespace with prefix-->
<news:notizie xmlns:news="http://www.9armonie.com/news"/>


<!--Default namespace-->
<notizie xmlns="http://www.9armonie.com/news"/>