Question

我们尝试使用以下Java代码将字符串转换为Byte[]：

String source = "0123456789";
byte[] byteArray = source.getBytes("UTF-16");

我们得到一个长度为22个字节的字节数组，我们不确定这个填充来自何处。如何获得长度为20的数组？

Answer 1

Alexander's answer解释了为什么它存在，但不解释如何摆脱它。您只需在编码名称中指定所需的字节序：

String source = "0123456789";
byte[] byteArray = source.getBytes("UTF-16LE"); // Or UTF-16BE

Answer 2

可能是前两个字节是Byte Order Mark。它指定了编码中使用的每个16位字的字节顺序。

Answer 3

尝试打印出十六进制的字节，以查看添加额外2个字节的位置 - 它们是在开头还是结尾？

我选择你会在开始时找到byte order marker（0xFEFF） - 这允许任何消费（接收）字节数组的人识别编码是小端还是大端。< / p>

Answer 4

UTF在开头有一个字节顺序标记，表示此流以特定格式编码。正如其他用户所指出的那样第一个字节是0XFE
第二个字节是0XFF
剩下的字节是
0
48个
0
49个
0
50个
0
51个
0
52个
0
53个
0
54个
0
55个
0
56个
0
57个