我的网站网址很少,我试图计算每个网站的MD5
哈希值。
如果网站提交到我的门户网站我想知道,之前在门户网站上提交过的网站。
所以我的想法是提取页面结构并计算MD5
哈希值。
例如:
<!DOCTYPE html>
<html>
<head>
<title></title>
</head>
<body>
Test Data
</body>
</html>
我使用以下PHP代码来提取结构:
$doc = new DomDocument();
$doc->loadHTML($str);
// Find needed div
$xpath = new DOMXpath($doc);
$elements = $xpath->query('//html');
// What to do if divs more that one?
if ($elements->length != 1) die("some divs in the document have class 'content'");
// Take first
$div = $elements->item(0);
// Echo content of node $div
echo $doc->saveHTML($div);
但是上面的代码将打印完整的HTML代码。就我而言,我只打印/回显HTML标签。而不是例如数据&#34;测试数据&#34;,在上面的html代码中提到。
- 的修改
我找到了解决方案:
$pattern = "/<[^>]*>/";
preg_match_all($pattern, $doc->saveHTML($div), $results);
print_r($results);
感谢所有