我在名称字段中收到了这个(因此它应该是一个人的名字) Ð~горNOE
可以解码什么?是UTF-8吗?翻译成什么语言?俄?
如果您可以给我一个提示或链接到网站,解释我应该从中得到哪些有意义的信件会有所帮助,谢谢:)
答案 0 :(得分:1)
这通常是UTF-8解释为一些单字节Windows编码。
String s = "Игорќ"; // Source encoding UTF-8
byte[] b = s.getBytes("Cp1252");
System.out.println("" + new String(b, StandardCharsets.UTF_8));
// Игорќ
数据可能很容易被破坏。上面我用Windows-1252(MS Windows Latin-1)得到了一些结果。必须使用UTF-8编码编译java源代码才能接受这些字符。
答案 1 :(得分:1)
由于您已将原始代码作为Stack Overflow粘贴到UTF-8编码的站点中,因此您的代码现在已完全编码为UTF-8。如果您想问自己有关数据编码的任何信息,您需要在原始原始字节上使用十六进制编辑器或类似工具。
无论如何,如果你这样做:
以某个单字节编码打开文本文件(可能是您的Windows副本使用的ANSI代码页,我使用的是Windows-1252)
粘贴Игорќ
乱码并保存文件
将文件重新加载为UTF-8
...你明白了:
Игорќ
所以它可能是有效的UTF-8错误解码。