我正在查询服务器以获取一些信息(以JSON形式返回),尤其是名称列表,其中一个名称返回包含奇怪的字符:
ÐÐμмањаœœÐ°Ñ,ÐμÑ〜иÑ>
应该是这样的:
НемањаМатејић
我尝试了以下内容:
json_decode
对其进行解码并直接取名并将其插入到我的UTF8编码的MySQL中数据库中。......无济于事 - 数据库中的价值仍然存在缺陷。
如何解决这个问题?
修改
运行SHOW VARIABLES LIKE '%character%'
返回
character_set_client utf8
character_set_connection utf8
character_set_database utf8
character_set_filesystem binary
character_set_results utf8
character_set_server latin1
character_set_system utf8
character_sets_dir /data/mysql/fuentez/share/mysql/charsets/
可能因为character_set_server是latin1吗?
答案 0 :(得分:1)
您将数据存储在数据库中latin1而不是UTF-8。
例如,编码为latin1的字符串е
变为0xd0 0xb5
,这是西里尔字母е
的UTF-8编码。
答案 1 :(得分:0)
使用俄语符号的json格式可能会很方便:
new json_decode function
<?php
function json_encode_my($value)
{
if (is_int($value)) {
return (string)$value;
} elseif (is_string($value)) {
$value = str_replace(array('\\', '/', '"', "\r", "\n", "\b", "\f", "\t"),
array('\\\\', '\/', '\"', '\r', '\n', '\b', '\f', '\t'), $value);
$convmap = array(0x80, 0xFFFF, 0, 0xFFFF);
$result = "";
for ($i = mb_strlen($value) - 1; $i >= 0; $i--) {
$mb_char = mb_substr($value, $i, 1);
if (mb_ereg("&#(\\d+);", mb_encode_numericentity($mb_char, $convmap, "UTF-8"), $match)) {
$result = sprintf("\\u%04x", $match[1]) . $result;
} else {
$result = $mb_char . $result;
}
}
return '"' . $result . '"';
} elseif (is_float($value)) {
return str_replace(",", ".", $value);
} elseif (is_null($value)) {
return 'null';
} elseif (is_bool($value)) {
return $value ? 'true' : 'false';
} elseif (is_array($value)) {
$with_keys = false;
$n = count($value);
for ($i = 0, reset($value); $i < $n; $i++, next($value)) {
if (key($value) !== $i) {
$with_keys = true;
break;
}
}
} elseif (is_object($value)) {
$with_keys = true;
} else {
return '';
}
$result = array();
if ($with_keys) {
foreach ($value as $key => $v) {
$result[] = json_encode((string)$key) . ':' . json_encode($v);
}
return '{' . implode(',', $result) . '}';
} else {
foreach ($value as $key => $v) {
$result[] = json_encode($v);
}
return '[' . implode(',', $result) . ']';
}
}
?>