我正在使用谷歌进行阿拉伯语翻译,这是我的代码:
header('Content-Type: text/html; charset=UTF-8');
$page=file_get_contents("http://www.google.com/translate_t?langpair=en|ar&text=hello",FILE_TEXT);
$page=substr($page,strpos($page,"TRANSLATED_TEXT")+strlen("TRANSLATED_TEXT")+2);
$page=substr($page,0,strpos($page,"';INPUT_TOOL_PATH"));
echo mb_detect_encoding($page); // edited 2015/05/26
echo mb_convert_encoding($page, 'UTF-8', 'ISO-8859-6');
如果你按照file_get_contents函数的链接,你会看到这个词:مرحبا
但如果您运行代码,您将获得:كرحبا
如您所见,最后一个(或第一个)角色不同!
我做错了什么?
答案 0 :(得分:2)
将最后一行替换为:
echo iconv('WINDOWS-1256', 'UTF-8', $page);
我认为这是因为你使用了错误的编码,如果你检查页面返回的内容字符集元素,你会发现它是windows-1256。