PHP:检索DOMElement的所有已声明的名称空间

时间:2010-03-18 13:57:12

标签: php dom xml-namespaces

我使用DOM extension来解析包含xml namespaces的xml文件。我原以为命名空间声明就像任何其他属性一样对待,但我的测试似乎不同意。我有一个像这样开头的文件:

<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns="http://purl.org/rss/1.0/"
    xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
    xmlns:prism="http://purl.org/rss/1.0/modules/prism/"
    xmlns:admin="http://webns.net/mvcb/"
    >

这样的测试代码:

$doc = new DOMDocument();
$doc->loadXml(file_get_contents('/home/soulmerge/tmp/rss1.0/recent.xml'));
$root = $doc->documentElement;
var_dump($root->tagName);
# prints 'string(7) "rdf:RDF"'
var_dump($root->attributes->item(0));
# prints 'NULL'
var_dump($root->getAttributeNode('xmlns'));
# prints 'object(DOMNameSpaceNode)#3 (0) {}'

所以问题是:

  1. 有谁知道我在哪里可以找到DOMNameSpaceNode的文档? search on php.net不会产生任何有用的结果。
  2. 如何从该DOMElement中提取所有这些命名空间声明?

2 个答案:

答案 0 :(得分:11)

除非有更直接的方法,否则您可以使用XPath及其namespace axis e.g。

<?php
$doc = new DOMDocument;
$doc->loadxml('<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns="http://purl.org/rss/1.0/"
    xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
    xmlns:prism="http://purl.org/rss/1.0/modules/prism/"
    xmlns:admin="http://webns.net/mvcb/"
    >
...
</rdf:RDF>');
$context = $doc->documentElement;

$xpath = new DOMXPath($doc);
foreach( $xpath->query('namespace::*', $context) as $node ) {
  echo $node->nodeValue, "\n";
}

打印

http://www.w3.org/XML/1998/namespace
http://webns.net/mvcb/
http://purl.org/rss/1.0/modules/prism/
http://purl.org/rss/1.0/modules/syndication/
http://purl.org/dc/elements/1.1/
http://purl.org/rss/1.0/modules/taxonomy/
http://purl.org/rss/1.0/
http://www.w3.org/1999/02/22-rdf-syntax-ns#

编辑和btw:我还没有找到DOMNameSpaceNode的文档。但是你可以从ext / dom / php_dom.c中的源代码中“删除”(部分)其功能 它似乎没有暴露任何方法并暴露属性

"nodeName", "nodeValue", "nodeType",
"prefix", "localName", "namespaceURI",
"ownerDocument", "parentNode"

所有函数都由相应的DOMNode属性处理。

答案 1 :(得分:4)

注意,

echo $root->getAttributeNode('xmlns')->nodeValue . "\n";
echo $root->getAttribute('xmlns') . "\n";
echo $root->getAttribute('xmlns:syn') . "\n";

按预期工作,并打印出来

http://purl.org/rss/1.0/
http://purl.org/rss/1.0/
http://purl.org/rss/1.0/modules/syndication/

因为DOMNameSpaceNode是Node,而不是NodeCollection。

请注意,除非PHP DOM扩展中的某些内容发生更改,否则XPath(如VolkerK所述)是获取所有命名空间的唯一本机方式,无论文档如何。