如何计算html标签和内容

时间:2010-03-17 09:25:21

标签: php html regex tags

我的正则表达式有问题! 如何用正则表达式计算html标签?

4 个答案:

答案 0 :(得分:2)

不要使用regexp使用DOM。我不确定你会怎么做但是DOM几乎肯定会更容易: http://php.net/manual/en/book.dom.php

答案 1 :(得分:1)

你没有!你为什么不试试DOMDocument

答案 2 :(得分:1)

正则表达式不是为此而设计的。确实有一个更好的解决方案,只需检查其他答案。

如果您只需要这一次,作为一个快速而肮脏的黑客,并且不关心边缘情况(如字符串中使用的转义标记),您可以使用"<\w+"来匹配起始标记,并计算比赛次数。

但你不应该这样做。 =)

答案 3 :(得分:1)

$data=file_get_contents("file");
$data=preg_replace("/\n+|[[:blank:]]+/","",$data);
print "number of tags: ". substr_count($data, '<');