我只想在保存到数据库之前从html字符串中删除注释和空格。我不希望它被修复并添加头标等。
我花了好几个小时搜索这个但找不到任何东西,有人做过这个可以告诉我我需要什么配置以及哪个php整理功能只是“缩小”而不是尝试从中制作有效的html文档一个HTML字符串?
答案 0 :(得分:0)
以下示例可以帮助您:
<?php
function html2txt($document){
$search = array('@<script[^>]*?>.*?</script>@si', // Strip out javascript
'@<[\/\!]*?[^<>]*?>@si', // Strip out HTML tags
'@<style[^>]*?>.*?</style>@siU', // Strip style tags properly
'@<![\s\S]*?--[ \t\n\r]*>@' // Strip multi-line comments including CDATA
);
$text = preg_replace($search, '', $document);
return $text;
}
?>
上获得更多信息
答案 1 :(得分:0)
你能试试吗,
以下功能用于删除不需要的HTML评论&amp;的空白,
function remove_html_comments_white_spaces($content = '') {
$content = preg_replace('~>\s+<~', '><', $content);
$content = preg_replace('/<!--(.|\s)*?-->/', '', $content);
return $content;
}
即使您想删除标签,也可以使用PHP内置函数strip_tags();