我在PHP中使用CURL,DOMDocument,loadHTML,DOMXPath来获取URL的内容。为了验证数据的有效性,我还检查了检索到的html,head和body标签的数量。
我的设置适用于我输入的大多数网址。但是,对于某些网址,报告的这些标记数量意外。 xPaths:
$html = $this->runXpath('/html');
$head = $this->runXpath('/html/head');
$body = $this->runXpath('/html/body');
支票:
if($html->length > 1) {
echo 'Too many html tags';
}
问题
我很乐意回答任何其他问题。提前谢谢!