我使用iconv
php函数,但有些字符无法正确转换:
...
$s = iconv('UTF-16', 'UTF-8', $s);
...
$s = iconv('UTF-16//IGNORE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE//IGNORE', 'UTF-8', $s);
...
我也尝试mb_convert_encoding
功能,但无法解决我的问题。
示例文本文件:9px.ir/utf8-16LE.rar
答案 0 :(得分:17)
iconv
supports the UTF-16LE
encoding。
您可以使用它将编码从UTF-16LE
转置为UTF-8
:
$result = iconv($in_charset = 'UTF-16LE' , $out_charset = 'UTF-8' , $str);
if (false === $result)
{
throw new Exception('Input string could not be converted.');
}
请参阅iconv
Docs。
我想知道UTF-16LE
中UTF-8
中是否有another box中提供的所有代码点。但我认为这应该适合你的情况。
编辑:我无法在自己的盒子上重现问题,但在mb_convert_encoding
Docs我遇到了这个通知:
注意:iconv()[function.iconv]:错误的字符集,从
UTF-16LE' to
转换为UTF-8'不允许......
看起来并非所有iconv
版本都能将UTF-16LE
转换为UTF-8
。
使用Demo可能是一种解决方法,至少在这种情况下({{3}}):
$result = mb_convert_encoding($str , 'UTF-8' , 'UTF-16LE');
答案 1 :(得分:0)
您应该在函数的第二个参数中使用 //TRANSLIT
或 //IGNORE
,它表示输出字符集。你在第一个参数中错误地使用了它。