Java“jsonify”简单字符串(“äh” - >“\ u00e4h”)

时间:2017-05-26 08:43:32

标签: java android json string

在Python中,我可以执行以下内容

# -*- coding: utf-8 -*-
import json
print json.dumps("äh")

在PHP中我可以执行

json_encode('äh')

两者都会产生"\u00e4h"

我怎样才能在Java中做同样的事情?我尝试使用JSONObject,但它只接受已包含键值的JSON字符串。

2 个答案:

答案 0 :(得分:0)

使用JSON实用程序打印UTF-8代码点在Java中有点过分。

在Java8中使用IntStream String.codePoints()

String text = "äh";
text.codePoints().forEach(c -> System.out.print("\\u" + String.format("%04Xh ", c)));

在早期的Java版本中(包括 Android SDK ):

String text = "äh";
for(int i = 0; i < text.length(); i++) {
    System.out.print("\\u" + String.format("%04Xh ", text.codePointAt(i)));
}

两者都导致:

\u00E4h \u0068h 

答案 1 :(得分:0)

对于JSON,您需要将某些字符转义为unicode转义序列(\u1234)。在大多数Java JSON库中,这样做(取自here):

/**
 * Escape quotes, \, /, \r, \n, \b, \f, \t and other control characters (U+0000 through U+001F).
 * @param s
 * @return
 */
public static String escape(String s){
    if(s==null)
        return null;
    StringBuffer sb = new StringBuffer();
    escape(s, sb);
    return sb.toString();
}

/**
 * @param s - Must not be null.
 * @param sb
 */
static void escape(String s, StringBuffer sb) {
    for(int i=0;i<s.length();i++){
        char ch=s.charAt(i);
        switch(ch){
        case '"':
            sb.append("\\\"");
            break;
        case '\\':
            sb.append("\\\\");
            break;
        case '\b':
            sb.append("\\b");
            break;
        case '\f':
            sb.append("\\f");
            break;
        case '\n':
            sb.append("\\n");
            break;
        case '\r':
            sb.append("\\r");
            break;
        case '\t':
            sb.append("\\t");
            break;
        case '/':
            sb.append("\\/");
            break;
        default:
            //Reference: http://www.unicode.org/versions/Unicode5.1.0/
            if((ch>='\u0000' && ch<='\u001F') || (ch>='\u007F' && ch<='\u009F') || (ch>='\u2000' && ch<='\u20FF')){
                String ss=Integer.toHexString(ch);
                sb.append("\\u");
                for(int k=0;k<4-ss.length();k++){
                    sb.append('0');
                }
                sb.append(ss.toUpperCase());
            }
            else{
                sb.append(ch);
            }
        }
    }//for
}

据我所知,上面的方法不会转义你的ä字符 - 因为它不需要转义,只要你使用UTF-8作为生成的JSON文本的编码,我想你想发送到某个地方。

所以要么使用UTF-8作为内容编码而不要逃避ä(不需要),要么修改上面的方法以逃避ch > 127的所有内容。即:

[...]
        default:
            //Reference: http://www.unicode.org/versions/Unicode5.1.0/
            if((ch > 127) || (ch>='\u0000' && ch<='\u001F') || (ch>='\u007F' && ch<='\u009F') || (ch>='\u2000' && ch<='\u20FF')){
                String ss=Integer.toHexString(ch);
                sb.append("\\u");
                for(int k=0;k<4-ss.length();k++){
                    sb.append('0');
                }
                sb.append(ss.toUpperCase());
            }
            else{
                sb.append(ch);
            }
[...]

然后它应该工作......