我正在使用像这样的PHP整洁:
$config = array(
'wrap' => 0,
'lower-literals' => 1,
'preserve-entities' => 1,
'drop-empty-paras' => 0
);
$tidy = new tidy;
$tidy->parseString($html, $config, 'utf8');
$tidy->cleanRepair();
当我用英文文本传递HTML时,它很好。但是,法语文本,它与编码有关。因此,如果我传递vérifier
之类的内容,那么它在输出中显示为vérifier
。我怎样才能整理好所有语言,至少是拉丁语。
另外,我将整理的输出传递给PHP的DOM文档,我应该在这里注意什么?
答案 0 :(得分:3)
看起来非常像UTF-8处理工作正常,但是你用latin-1而不是UTF-8来解释结果。设置适当的HTTP标头或元标记,指示浏览器使用UTF-8读取文档。
header('Content-Type:text/html; charset=utf-8');