我正在寻找一种算法来压缩我用PHP编写的CMS的HTML输出,用CodeIgniter框架编写。
我在尝试删除除<script>
,<pre>
和<style>
元素之外的任何尖括号之间的空格,并且为了简单起见,忽略这些元素。我应该澄清这是连续标签之间的空白,它们之间没有文字。
我应该如何解析HTML以找到我要删除的空格?
编辑:
首先,我想删除不在<pre>
标记中的所有标签字符。这可以用正则表达式完成,我敢肯定,但有哪些替代方案?
答案 0 :(得分:7)
别。空白可以忽略不计。最好使用输出压缩,with zlib或here for example
答案 1 :(得分:4)
现有的HTML缩小解决方案是否有问题?
(第二个链接转到源代码,它注释了它所采取的步骤 - 如果你想创建自己的代码,应该是一个好的方法 - 它是BSD licensed。)
另外,作为Pete says,您可以通过对HTML(和CSS / JS /等)使用gzip压缩来使更多更多受益,并且不会被诸如此类的问题绊倒戈登在评论中提到过。