当我尝试从windows-1256
更改为utf8
时,文字变得像那样
ÇáÑßä ÇáÚÇã ááãæÇÖíÚ ÇáÚÇãÉ
我试图更改我使用file_get_contents
抓取的网页的编码。
header('Content-Type: text/html; charset=utf-8');
答案 0 :(得分:2)
这听起来像是iconv
的工作$output = iconv("ISO-8859-1", "UTF-8", file_get_contents($url));
由于我无法知道您的内容是什么,您可能需要尝试UTF-8 // TRANSLIT和UTF-8 // IGNORE
答案 1 :(得分:1)
虽然我不懂阿拉伯语,但这可能会指向正确的方向:
$str = 'ÇáÑßä ÇáÚÇã ááãæÇÖíÚ ÇáÚÇãÉ';
$str = iconv("windows-1256", "utf-8//TRANSLIT//IGNORE", $str);
echo $str;