将Java字节读取为CharSet

时间:2013-04-24 20:40:15

标签: java character-encoding

特定CharSet是否会影响与每个字节关联的二进制(或整数)值?

示例:

String original = foo(); // makes string

byte[] utf8Bytes = original.getBytes("UTF8"); // CharSet is UTF8
byte[] defaultBytes = original.getBytes(); // default CharSet 

utf8Bytes[1]总是等于二进制/整数值的defaultBytes[1]吗?

1 个答案:

答案 0 :(得分:2)

它会影响值,并且UTF-8不是所有JVM的默认值 - 最好始终使用getBytes("UTF-8")来确保编码一致。

例如,使用getBytes("UTF-8")getBytes("UTF-16")并比较结果(后者的字节数可能是前者的两倍)