使用PHP查找页面中使用的HTML标记的总数

时间:2015-12-04 11:11:30

标签: php html

我的网站网址很少,我试图计算每个网站的MD5哈希值。

如果网站提交到我的门户网站我想知道,之前在门户网站上提交过的网站。

所以我的想法是提取页面结构并计算MD5哈希值。

例如:

<!DOCTYPE html>
 <html>
 <head>
    <title></title>
 </head>
 <body>
   Test Data
 </body>
 </html>

我使用以下PHP代码来提取结构:

$doc = new DomDocument();
$doc->loadHTML($str);
// Find needed div
$xpath = new DOMXpath($doc);
$elements = $xpath->query('//html');
// What to do if divs more that one?
if ($elements->length != 1) die("some divs in the document have class 'content'");
// Take first
$div = $elements->item(0);
// Echo content of node $div
echo $doc->saveHTML($div);

但是上面的代码将打印完整的HTML代码。就我而言,我只打印/回显HTML标签。而不是例如数据&#34;测试数据&#34;,在上面的html代码中提到。

- 的修改

我找到了解决方案:

$pattern = "/<[^>]*>/";
preg_match_all($pattern, $doc->saveHTML($div), $results);
print_r($results);

感谢所有

0 个答案:

没有答案