PHP - 使用file_get_contents更改阿拉伯字符的字符集

时间:2015-05-17 21:08:14

标签: php utf-8 file-get-contents arabic

我正在使用谷歌进行阿拉伯语翻译,这是我的代码:

header('Content-Type: text/html; charset=UTF-8');
$page=file_get_contents("http://www.google.com/translate_t?langpair=en|ar&text=hello",FILE_TEXT);
$page=substr($page,strpos($page,"TRANSLATED_TEXT")+strlen("TRANSLATED_TEXT")+2);
$page=substr($page,0,strpos($page,"';INPUT_TOOL_PATH"));
echo mb_detect_encoding($page); // edited 2015/05/26
echo mb_convert_encoding($page, 'UTF-8', 'ISO-8859-6');

如果你按照file_get_contents函数的链接,你会看到这个词:مرحبا

但如果您运行代码,您将获得:كرحبا

如您所见,最后一个(或第一个)角色不同!

我做错了什么?

1 个答案:

答案 0 :(得分:2)

将最后一行替换为:

echo iconv('WINDOWS-1256', 'UTF-8', $page);

我认为这是因为你使用了错误的编码,如果你检查页面返回的内容字符集元素,你会发现它是windows-1256。