Question

我有一些阿拉伯语编码和乌克兰语（cyrillyc）的字符串，如下所示：

$string = "&#1575;&#1616;&#1574;&#1618;&#1578;&#1616;&#1604;&#1575;&#1601;&#1616;&#1610;&#1617;&#1612; - коаліційний, гармонійний;";

我希望得到字符（阿拉伯语）而不是所有这些“＆amp; #xxxx;”s。

如果我把这个字符串放到html中，我就得到了我想要的东西： “ائتلافي - коаліційний，гармонійний;”

但是当我使用html_entitis_decode时，它什么也没做。（mb因为阿拉伯语编码不支持此功能，只是基本的ASCII）。那么，请告诉我如何才能获得与浏览器解释器相同的结果？

Answer 1

您的PHP版本可能早于 5.4.0 ，因此html_entity_decode未使用 UTF-8 。

要使用的编码。如果省略，则该参数的默认值为5.4.0之前的PHP版本中的ISO-8859-1，以及PHP 5.4.0之后的UTF-8。

尝试以下方法：

$decoded_string = html_entity_decode($string, ENT_COMPAT | ENT_HTML401, "UTF-8");