PHP domdocument修改了我的内容

时间:2017-04-13 09:19:52

标签: php domdocument

我正在使用PHP DOM文档从我的WordPress文章中删除标签。     我的代码工作正常。但是在保存我的内容时,  它还为文本内容添加了

标记。很少有文章得到像Â一样的特殊字符,  我尝试通过编码HTML内容加载,但我仍然得到相同的结果。这就是我加载内容的方式

$dom = new DOMDocument('1.0', 'UTF-8');//dom instant
libxml_use_internal_errors(true);//for setting error false
    $dom->loadHTML(mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8'), LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);//LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD are to remove HTML wrapper 

它将我的内容加载到html并且没有html包装器

1 个答案:

答案 0 :(得分:0)

mb_convert_encoding函数通常有效。你是否将HTML中的charset设置为utf-8?在您加载的页面上:

<meta http-equiv="content-type" content="text/html;charset=utf-8">