我想阅读以下xml中的<q:content></q:content>
标记内的内容 -
$xml = '<?xml version="1.0"?>
<q:response xmlns:q="http://api-url">
<q:impression>
<q:content>
<html>
<head>
<meta name="HandheldFriendly" content="True">
<meta name="viewport" content="width=device-width, user-scalable=no">
<meta http-equiv="cleartype" content="on">
</head>
<body style="margin:0px;padding:0px;">
<iframe scrolling="no" src="http://some-url" width="320px" height="50px" style="border:none;"></iframe>
</body>
</html>
</q:content>
<q:cpc>0.02</q:cpc>
</q:impression>
...
... some more things
...
</q:response>';
我已将xml放在上面的变量中,然后我使用{Example#1获取文档命名空间“部分中给出的SimpleXMLElement::getNamespaces -
//code continued
$dom = new DOMDocument;
// load the XML string defined above
$dom->loadXML($xml);
var_dump($dom->getElementsByTagNameNS('http://api-url', '*') ); // shows object(DOMNodeList)#3 (0) { }
foreach ($dom->getElementsByTagNameNS('http://api-url', '*') as $element)
{
//this does not execute
echo 'see - local name: ', $element->localName, ', prefix: ', $element->prefix, "\n";
}
但for循环中的代码不会执行。
我已经阅读了这些问题 -
更新
还尝试了此解决方案Parse XML with Namespace using SimpleXML -
$xml = new SimpleXMLElement($xml);
$xml->registerXPathNamespace('e', 'http://api-url');
foreach($xml->xpath('//e:q') as $event) {
echo "not coming here";
$event->registerXPathNamespace('e', 'http://api-url');
var_export($event->xpath('//e:content'));
}
在这种情况下,foreach中的代码也不会执行。 不确定我是否写得正确......
进一步更新
使用第一个解决方案...使用error_reporting = -1,发现问题出在src
标记的iframe
attr中的URL。收到像 -
Warning: DOMDocument::loadXML(): EntityRef: expecting ';' in Entity, line: 13
更新代码 -
$xml = '<?xml version="1.0"?>
<q:response xmlns:q="http://api-url">
<q:impression>
<q:content>
<html>
<head>
<meta name="HandheldFriendly" content="True" />
<meta name="viewport" content="width=device-width, user-scalable=no" />
<meta http-equiv="cleartype" content="on" />
</head>
<body style="margin:0px;padding:0px;">
<iframe scrolling="no" src="http://serve.qriously.com/v1/request?type=SERVE&aid=ratingtest&at=2&uid=0000000000000000&noHash=true&testmode=true&ua=Mozilla/5.0 (Linux; U; Android 2.2.1; en-us; Nexus One Build/FRG83) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1&appid=12e2561f048158249e30000012e256826ad&pv=2&rf=2&src=admarvel&type=get&lang=eng" width="320px" height="50px" style="border:none;"></iframe>
</body>
</html>
</q:content>
<q:cpc>0.02</q:cpc>
</q:impression>
<q:app_stats>
<q:total><q:ctr>0.023809523809523808</q:ctr><q:ecpm>0.5952380952380952</q:ecpm></q:total>
<q:today><q:ctr>0.043478260869565216</q:ctr><q:ecpm>1.0869565217391306</q:ecpm></q:today>
</q:app_stats>
</q:response>';
答案 0 :(得分:4)
我没有问题让它工作,我唯一能找到的错误就是你正在加载包含非XML HTML块的XML,这会破坏文档:head部分中的meta元素不是闭合。
提示:始终激活错误记录和报告,如果您开发和调试代码,请检查警告和通知。一个简短的单行显示所有类错误消息,包括警告,通知和严格:
error_reporting(-1); ini_set('display_errors', 1);
在加载XML时,DOMDocument对于格式错误的元素很有说服力。
DomDocument只接受有效的XML。如果你有HTML,你可以尝试DOMDocument::loadHTML()
完成这项工作,但是它会将加载的字符串转换为X(HT)ML文档。可能不是你想要的。
要转义要加载的字符串的特定部分以使其与XML兼容,您可以搜索字符串模式以获取表示XML内部HTML的子字符串,并对其进行正确的XML编码。
E.g。您可以查找<html>
和</html>
作为周围标记,提取整个子字符串并将其替换为substr_replace()
。要对HTML进行编码以便在XML中使用数据,请使用htmlspecialchars()
函数,它将用the other SO answer中的五个实体替换所有内容。
一些模拟代码:
$htmlStart = strpos($xml, '<html>');
if (false === $htmlStart) throw new Exception('<html> not found.');
$htmlEnd = strpos($xml, '</html>', $htmlStart);
if (false === $htmlStart) throw new Exception('</html> not found.');
$htmlLen = $htmlEnd - $htmlStart + 7;
$htmlString = substr($xml, $htmlStart, $htmlLen);
$htmlEscaped = htmlspecialchars($htmlString, ENT_QUOTES);
$xml = substr_replace($xml, $htmlEscaped, $htmlStart, $htmlLen);