如何使用PHP Simple HTML DOM解析器解析中文字符?

时间:2012-06-29 07:16:02

标签: php parsing simple-html-dom

我正在尝试使用简单HTML DOM(http://simplehtmldom.sourceforge.net)解析中文网站,但面临的问题是所有解析的中文字符都成为无法识别的符号。

示例:“星洲网”变成了“æ〜Ÿæ'²ç¶²”

如何使用Simple HTML DOM解析UTF-8字符?或者我在编码中做错了什么?

以下是我的PHP编码:

<?php
require_once ("simple_html_dom.php");

$html = file_get_html("http://www.sinchew-i.com");
print $html->plaintext;
?>

1 个答案:

答案 0 :(得分:0)

header('Content-Type: text/html; charset=utf-8');

选中此Handling unicode