我有一个处理各种语言的PHP脚本。不幸的是,每当我尝试使用json_encode
时,任何Unicode输出都会转换为十六进制实体。这是预期的行为吗?有没有办法将输出转换为UTF-8字符?
以下是我所看到的一个例子:
INPUT
echo $text;
输出
База данни грешка.
INPUT
json_encode($text);
输出
"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
答案 0 :(得分:271)
自PHP / 5.4.0起,有一个名为"JSON_UNESCAPED_UNICODE"
的选项。看看:
http://se2.php.net/json_encode
因此你应该尝试:
json_encode( $text, JSON_UNESCAPED_UNICODE );
答案 1 :(得分:53)
JSON_UNESCAPED_UNICODE适用于PHP 5.4或更高版本 以下代码适用于5.3版。
<强>已更新强>
html_entity_decode
比pack
+ mb_convert_encoding
更有效率。(*SKIP)(*FAIL)
跳过反斜杠本身并按JSON_HEX_*
标记指定字符。
function raw_json_encode($input, $flags = 0) {
$fails = implode('|', array_filter(array(
'\\\\',
$flags & JSON_HEX_TAG ? 'u003[CE]' : '',
$flags & JSON_HEX_AMP ? 'u0026' : '',
$flags & JSON_HEX_APOS ? 'u0027' : '',
$flags & JSON_HEX_QUOT ? 'u0022' : '',
)));
$pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
$callback = function ($m) {
return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
};
return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}
答案 2 :(得分:2)
一种解决方案是首先对数据进行编码,然后在同一文件中对其进行解码:
$string =json_encode($input, JSON_UNESCAPED_UNICODE) ;
echo $decoded = html_entity_decode( $string );
答案 3 :(得分:1)
您想设置字符集和未转义的unicode
header('Content-Type: application/json;charset=utf-8');
json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);
答案 4 :(得分:1)
这是我针对各种PHP版本的组合解决方案。
在我的公司中,我们正在使用具有各种PHP版本的不同服务器,因此我必须找到适用于所有服务器的解决方案。
$phpVersion = substr(phpversion(), 0, 3)*1;
if($phpVersion >= 5.4) {
$encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
$encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}
贷方应转到Marco Gasi和abu。 json_encode文档中提供了PHP> = 5.4的解决方案。
答案 5 :(得分:0)
raw_json_encode()函数above不能解决我的问题(由于某种原因,回调函数在我的PHP 5.2.5服务器上引发了错误)。
但是其他解决方案确实有效。
https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html
积分应转到Marco Gasi。我只是调用他的函数,而不是调用json_encode():
function jsonRemoveUnicodeSequences( $json_struct )
{
return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}
答案 6 :(得分:0)
json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);
答案 7 :(得分:-1)
因为你问:
有没有办法将输出转换为UTF-8字符?
另一种解决方案是使用utf8_encode。
这会将您的字符串编码为prefix
。
e.g。
statistics2 <- statistics2[startsWith(as.character(statistics2$Series_Name),
prefix = c("Health expenditure per capita","Life expectancy at birth total (years)")), ]
答案 8 :(得分:-5)