这解码了什么,是UTF吗? Ð~горNOE

时间:2016-12-12 08:21:58

标签: encoding utf

我在名称字段中收到了这个(因此它应该是一个人的名字) Ð~горNOE

可以解码什么?是UTF-8吗?翻译成什么语言?俄?

如果您可以给我一个提示或链接到网站,解释我应该从中得到哪些有意义的信件会有所帮助,谢谢:)

2 个答案:

答案 0 :(得分:1)

这通常是UTF-8解释为一些单字节Windows编码。

        String s = "Игорќ"; // Source encoding UTF-8
        byte[] b = s.getBytes("Cp1252");
        System.out.println("" + new String(b, StandardCharsets.UTF_8));
        // Игорќ

数据可能很容易被破坏。上面我用Windows-1252(MS Windows Latin-1)得到了一些结果。必须使用UTF-8编码编译java源代码才能接受这些字符。

答案 1 :(得分:1)

由于您已将原始代码作为Stack Overflow粘贴到UTF-8编码的站点中,因此您的代码现在已完全编码为UTF-8。如果您想问自己有关数据编码的任何信息,您需要在原始原始字节上使用十六进制编辑器或类似工具。

无论如何,如果你这样做:

  1. 以某个单字节编码打开文本文件(可能是您的Windows副本使用的ANSI代码页,我使用的是Windows-1252)

  2. 粘贴Игорќ乱码并保存文件

  3. 将文件重新加载为UTF-8

  4. ...你明白了:

    Игорќ
    

    所以它可能是有效的UTF-8错误解码。