如何在PHP中解析HTML以进行缩小?

时间:2010-06-30 15:04:12

标签: php html codeigniter html-parsing

我正在寻找一种算法来压缩我用PHP编写的CMS的HTML输出,用CodeIgniter框架编写。

我在尝试删除除<script><pre><style>元素之外的任何尖括号之间的空格,并且为了简单起见,忽略这些元素。我应该澄清这是连续标签之间的空白,它们之间没有文字。

我应该如何解析HTML以找到我要删除的空格?

编辑: 首先,我想删除不在<pre>标记中的所有标签字符。这可以用正则表达式完成,我敢肯定,但有哪些替代方案?

2 个答案:

答案 0 :(得分:7)

别。空白可以忽略不计。最好使用输出压缩,with zlibhere for example

答案 1 :(得分:4)

现有的HTML缩小解决方案是否有问题?

Minify执行HTML(以及CSS和JS)。

(第二个链接转到源代码,它注释了它所采取的步骤 - 如果你想创建自己的代码,应该是一个好的方法 - 它是BSD licensed。)

另外,作为Pete says,您可以通过对HTML(和CSS / JS /等)使用gzip压缩来使更多更多受益,并且不会被诸如此类的问题绊倒戈登在评论中提到过。