我正在使用PHP DOM文档从我的WordPress文章中删除标签。 我的代码工作正常。但是在保存我的内容时, 它还为文本内容添加了
标记。很少有文章得到像Â一样的特殊字符, 我尝试通过编码HTML内容加载,但我仍然得到相同的结果。这就是我加载内容的方式
$dom = new DOMDocument('1.0', 'UTF-8');//dom instant
libxml_use_internal_errors(true);//for setting error false
$dom->loadHTML(mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8'), LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);//LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD are to remove HTML wrapper
它将我的内容加载到html并且没有html包装器
答案 0 :(得分:0)
mb_convert_encoding函数通常有效。你是否将HTML中的charset设置为utf-8?在您加载的页面上:
<meta http-equiv="content-type" content="text/html;charset=utf-8">