PHP整洁和字符编码

时间:2011-08-17 12:43:37

标签: php character-encoding

我正在使用像这样的PHP整洁:

$config = array(
                'wrap'                         => 0,
                'lower-literals'               => 1,
                'preserve-entities'            => 1,
                'drop-empty-paras'             => 0
                );

$tidy = new tidy;

$tidy->parseString($html, $config, 'utf8');

$tidy->cleanRepair();

当我用英文文本传递HTML时,它很好。但是,法语文本,它与编码有关。因此,如果我传递vérifier之类的内容,那么它在输出中显示为vérifier。我怎样才能整理好所有语言,至少是拉丁语。

另外,我将整理的输出传递给PHP的DOM文档,我应该在这里注意什么?

1 个答案:

答案 0 :(得分:3)

看起来非常像UTF-8处理工作正常,但是你用latin-1而不是UTF-8来解释结果。设置适当的HTTP标头或元标记,指示浏览器使用UTF-8读取文档。

header('Content-Type:text/html; charset=utf-8');