在Python中,我可以执行以下内容
# -*- coding: utf-8 -*-
import json
print json.dumps("äh")
在PHP中我可以执行
json_encode('äh')
两者都会产生"\u00e4h"
我怎样才能在Java中做同样的事情?我尝试使用JSONObject
,但它只接受已包含键值的JSON字符串。
答案 0 :(得分:0)
使用JSON实用程序打印UTF-8代码点在Java中有点过分。
在Java8中使用IntStream String.codePoints()
:
String text = "äh";
text.codePoints().forEach(c -> System.out.print("\\u" + String.format("%04Xh ", c)));
在早期的Java版本中(包括 Android SDK ):
String text = "äh";
for(int i = 0; i < text.length(); i++) {
System.out.print("\\u" + String.format("%04Xh ", text.codePointAt(i)));
}
两者都导致:
\u00E4h \u0068h
答案 1 :(得分:0)
对于JSON,您需要将某些字符转义为unicode转义序列(\u1234
)。在大多数Java JSON库中,这样做(取自here):
/**
* Escape quotes, \, /, \r, \n, \b, \f, \t and other control characters (U+0000 through U+001F).
* @param s
* @return
*/
public static String escape(String s){
if(s==null)
return null;
StringBuffer sb = new StringBuffer();
escape(s, sb);
return sb.toString();
}
/**
* @param s - Must not be null.
* @param sb
*/
static void escape(String s, StringBuffer sb) {
for(int i=0;i<s.length();i++){
char ch=s.charAt(i);
switch(ch){
case '"':
sb.append("\\\"");
break;
case '\\':
sb.append("\\\\");
break;
case '\b':
sb.append("\\b");
break;
case '\f':
sb.append("\\f");
break;
case '\n':
sb.append("\\n");
break;
case '\r':
sb.append("\\r");
break;
case '\t':
sb.append("\\t");
break;
case '/':
sb.append("\\/");
break;
default:
//Reference: http://www.unicode.org/versions/Unicode5.1.0/
if((ch>='\u0000' && ch<='\u001F') || (ch>='\u007F' && ch<='\u009F') || (ch>='\u2000' && ch<='\u20FF')){
String ss=Integer.toHexString(ch);
sb.append("\\u");
for(int k=0;k<4-ss.length();k++){
sb.append('0');
}
sb.append(ss.toUpperCase());
}
else{
sb.append(ch);
}
}
}//for
}
据我所知,上面的方法不会转义你的ä
字符 - 因为它不需要转义,只要你使用UTF-8作为生成的JSON文本的编码,我想你想发送到某个地方。
所以要么使用UTF-8作为内容编码而不要逃避ä
(不需要),要么修改上面的方法以逃避ch > 127
的所有内容。即:
[...]
default:
//Reference: http://www.unicode.org/versions/Unicode5.1.0/
if((ch > 127) || (ch>='\u0000' && ch<='\u001F') || (ch>='\u007F' && ch<='\u009F') || (ch>='\u2000' && ch<='\u20FF')){
String ss=Integer.toHexString(ch);
sb.append("\\u");
for(int k=0;k<4-ss.length();k++){
sb.append('0');
}
sb.append(ss.toUpperCase());
}
else{
sb.append(ch);
}
[...]
然后它应该工作......