我有一些阿拉伯语编码和乌克兰语(cyrillyc)的字符串,如下所示:
$string = "اِئْتِلافِيٌّ - коаліційний, гармонійний;";
我希望得到字符(阿拉伯语)而不是所有这些“& #xxxx;”s。
如果我把这个字符串放到html中,我就得到了我想要的东西: “ائتلافي - коаліційний,гармонійний;”
但是当我使用html_entitis_decode时,它什么也没做。 (mb因为阿拉伯语编码不支持此功能,只是基本的ASCII)。 那么,请告诉我如何才能获得与浏览器解释器相同的结果?
答案 0 :(得分:1)
您的PHP版本可能早于 5.4.0 ,因此html_entity_decode
未使用 UTF-8 。
要使用的编码。如果省略,则该参数的默认值为5.4.0之前的PHP版本中的ISO-8859-1,以及PHP 5.4.0之后的UTF-8。
http://php.net/manual/en/function.html-entity-decode.php
尝试以下方法:
$decoded_string = html_entity_decode($string, ENT_COMPAT | ENT_HTML401, "UTF-8");