我正在使用DOMDocument
从网络浏览器接收数据,以下是我需要帮助的示例:
Around the Web…
如您所见,该句中有许多奇怪的字符。如何将其翻译成可查看的句子?有php function
吗?
答案 0 :(得分:0)
问题是字符的编码。在读取DOM时,还要检索字符编码并使用它来读取文本:
答案 1 :(得分:0)
编码
的问题显而易见可以有几种选择:
PS。如果输入数据不是UTF8,你需要mb_convert_encoding函数,但是你将它们存储为utf8
更新:这是utf8保存php文件,它正常工作:
$original_string = '<html><head><meta charset="utf-8" /></head><body><a href="/around-the-web/" rel="bookmark" title="Permanent Link to Around the Web…">Around the Web…</a></body></html>';
$doc = new DOMDocument();
$doc->loadHTML($original_string);
header('Content-type: text/html; charset=utf-8');
echo $doc->actualEncoding . '<br>';
echo $doc->xmlEncoding . '<br>';
echo $doc->saveHTML();