我正在开发一个函数,它将使用php将HTML转换为纯文本版本。我已尝试使用strip_tags()
,如下所示,
$html='<style type="text/css">
@media only screen and (max-width: 480px) {
.message_mobile {
width: 100% !important;
}
}
</style>
<p class="message_mobile"> sample Text</p>';
$plain_text =strip_tags($html);
echo $plain_text;
但它会创建像
这样的输出 @media only screen and (max-width: 480px) {
.message_mobile {
width: 100% !important;
}
}
sample Text
但我不需要<style>
标签内的内容。如何做到这一点?
我有另一个问题,当我尝试用表剥离标签时,它会产生不需要的线刹。如何解决这些问题?
有没有什么好方法可以从HTML创建纯文本?
答案 0 :(得分:0)
使用此功能:
<?php
function strip_html_tags($str){
$str = preg_replace('/(<|>)\1{2}/is', '', $str);
$str = preg_replace(
array(// Remove invisible content
'@<head[^>]*?>.*?</head>@siu',
'@<style[^>]*?>.*?</style>@siu',
'@<script[^>]*?.*?</script>@siu',
'@<noscript[^>]*?.*?</noscript>@siu',
),
"", //replace above with nothing
$str );
$str = replaceWhitespace($str);
$str = strip_tags($str);
return $str;
} //function strip_html_tags ENDS
//To replace all types of whitespace with a single space
function replaceWhitespace($str) {
$result = $str;
foreach (array(
" ", " \t", " \r", " \n",
"\t\t", "\t ", "\t\r", "\t\n",
"\r\r", "\r ", "\r\t", "\r\n",
"\n\n", "\n ", "\n\t", "\n\r",
) as $replacement) {
$result = str_replace($replacement, $replacement[0], $result);
}
return $str !== $result ? replaceWhitespace($result) : $result;
}
$html='<style type="text/css">
@media only screen and (max-width: 480px) {
.message_mobile {
width: 100% !important;
}
}
</style>
<p class="message_mobile"> sample Text</p>';
$plain_text = strip_html_tags($html);
echo $plain_text;
答案 1 :(得分:0)
您正在寻找的功能是htmlspecialchars。
此代码:
<?php
$htmltag = '
<style type="text/css">
@media only screen and (max-width: 480px) {
.message_mobile {
width: 100% !important;
}
}
</style>
<p class="message_mobile"> sample Text</p>';
echo "<pre>".nl2br(htmlspecialchars($htmltag))."</pre>";
?>
将在您的网站上创建此输出:
<style type="text/css">
@media only screen and (max-width: 480px) {
.message_mobile {
width: 100% !important;
}
}
</style>
<p class="message_mobile"> sample Text</p>
答案 2 :(得分:0)