api返回奇怪的字符而不是foriegn语言

时间:2016-02-21 17:35:20

标签: php ajax urdu

我正在尝试使用基于ajax的API来获取Urdu语言的内容,但问题是每当我访问api时我看到奇怪的字符,我认为服务器在返回结果之前没有正确编码

The api endpoint

要返回正确的乌尔都语字符,您需要先将mb_convert_encoding函数发送给客户端,但因为它只是公共API而我无法访问其服务器我无法执行此操作

我想将它们转换回适当的乌尔都语字符

像这样的东西

$strangeLetters = '\u06c1\u062a\u06d2 \u0641\u0644\u0633\u0637\u06cc\u0646\u06cc\u0648\u06ba \u067e\u0631 \u0627\u0633\u0631\u0627\u0626\u06cc\u0644\u06cc \u062c\u0627\u0631\u062d\u06cc\u062a \u062c\u0646\u06af\u06cc \u062c\u0631\u0627\u0626\u0645 \u06a9\u06d2 \u0632\u0645\u0631\u06d2 \u0645\u06cc\u06ba \u0622\u062a\u06cc \u06c1\u06d2\u060c \u0648\u0632\u06cc\u0631\u0627\u0639\u0638\u0645';

$properUrduCharacters = someFunction(
$strangeLetters);

echo $properUrduCharacters;

结果:

ہتے فلسطینیوں پر اسرائیلی جارحیت جنگی جرائم کے زمرے میں آتی ہے، وزیراعظم

1 个答案:

答案 0 :(得分:1)

使用PHP显示unicode数据的快捷方法:

echo json_decode('"\u06c1"');

其他解决方案: How to decode Unicode escape sequences like "\u00ed" to proper UTF-8 encoded characters?

对于你的例子:

<?php
$strangeLetters = '\u06c1\u062a\u06d2 \u0641\u0644\u0633\u0637\u06cc\u0646\u06cc\u0648\u06ba \u067e\u0631 \u0627\u0633\u0631\u0627\u0626\u06cc\u0644\u06cc \u062c\u0627\u0631\u062d\u06cc\u062a \u062c\u0646\u06af\u06cc \u062c\u0631\u0627\u0626\u0645 \u06a9\u06d2 \u0632\u0645\u0631\u06d2 \u0645\u06cc\u06ba \u0622\u062a\u06cc \u06c1\u06d2\u060c \u0648\u0632\u06cc\u0631\u0627\u0639\u0638\u0645';

$strange = explode('\u', $strangeLetters);


foreach($strange as $letter){
  echo json_decode('"\u'.$letter.'"');
}

var_dump($strange);