Java Char为其unicode十六进制字符串表示形式,反之亦然

时间:2013-05-27 09:06:32

标签: java parsing unicode char hex

我需要将Java字符的十六进制代码生成为字符串,稍后再次解析这些字符串。我发现here解析可以执行如下:

char c = "\u041f".toCharArray()[0];

我希望有一些像Integer.valueOf()更优雅的东西进行解析。

如何正确生成十六进制unicode?

3 个答案:

答案 0 :(得分:13)

这将生成char:

的十六进制字符串表示形式
char ch = 'ö';
String hex = String.format("%04x", (int) ch);

这会将十六进制字符串转换回char:

int hexToInt = Integer.parseInt(hex, 16);
char intToChar = (char)hexToInt;

答案 1 :(得分:6)

在做了更深入的阅读之后,javadoc说基于char参数的Character方法不支持所有unicode值,但是那些采用代码点(即int)的方法。

因此,我一直在进行以下测试:

    int codePointCopyright = Integer.parseInt("00A9", 16);

    System.out.println(Integer.toHexString(codePointCopyright));
    System.out.println(Character.isValidCodePoint(codePointCopyright));

    char[] toChars = Character.toChars(codePointCopyright);
    System.out.println(toChars);

    System.out.println();

    int codePointAsian = Integer.parseInt("20011", 16);

    System.out.println(Integer.toHexString(codePointAsian));
    System.out.println(Character.isValidCodePoint(codePointAsian));

    char[] toCharsAsian = Character.toChars(codePointAsian);
    System.out.println(toCharsAsian);

我得到了:

enter image description here

因此,我不应该在我的问题中讨论char,而应该讨论字符数组,因为Unicode字符可以用多个char来表示。另一方面,int涵盖了所有内容。

答案 2 :(得分:5)

在字符串级别: 以下不是char而是int,比如中文,但也适用于chars。

    int cp = "\u041f".codePointAt(0);
    String s = new String(Character.toChars(cp));

在native2ascii级别: 如果您想在\uXXXX和Unicode字符之间来回转换,请使用 apache,commons-lang StringEscapeUtils

    String t = StringEscapeUtils.escapeJava(s + "ö");
    System.out.println(t);

在命令行中,native2ascii可以在u-escaped和UTF-8之间来回转换文件。