UTF8_encode后的奇怪字符

时间:2013-01-30 01:45:31

标签: php utf-8 encode arabic

当我尝试从windows-1256更改为utf8时,文字变得像那样

ÇáÑßä ÇáÚÇã ááãæÇÖíÚ ÇáÚÇãÉ

我试图更改我使用file_get_contents抓取的网页的编码。

header('Content-Type: text/html; charset=utf-8');

2 个答案:

答案 0 :(得分:2)

这听起来像是iconv

的工作
$output = iconv("ISO-8859-1", "UTF-8", file_get_contents($url));

由于我无法知道您的内容是什么,您可能需要尝试UTF-8 // TRANSLIT和UTF-8 // IGNORE

答案 1 :(得分:1)

虽然我不懂阿拉伯语,但这可能会指向正确的方向:

$str = 'ÇáÑßä ÇáÚÇã ááãæÇÖíÚ ÇáÚÇãÉ';
$str = iconv("windows-1256", "utf-8//TRANSLIT//IGNORE", $str);
echo $str;