Java是以小端还是大端读取整数?

时间:2008-12-12 10:21:17

标签: java endianness

我问,因为我正在从C进程向Java发送字节流。在C端,32位整数的LSB是第一个字节,MSB是第4个字节。

所以我的问题是:在Java端,当我们读取从C进程发送的字节时,Java端的endian是什么?

后续问题:如果Java端的endian与发送的端序不同,我该如何在它们之间进行转换?

8 个答案:

答案 0 :(得分:60)

使用网络字节顺序(big endian),这与Java使用的顺序相同。请参阅C中的不同翻译人员。

答案 1 :(得分:42)

我在谷歌这里偶然发现并得到了我的答案,即Java是大端。

通过回答我想指出字节确实有一个字节顺序,尽管如果你只处理“主流”微处理器,你不可能像英特尔,摩托罗拉那样遇到它。和Zilog都同意他们的UART芯片的移位方向,并且一个字节的MSB将是2 ** 7而LSB在他们的CPU中将是2 ** 0(我使用FORTRAN电源符号来强调这些东西的年龄: ))。

20多年前,当我们用Mac计算机替换了价值10美元的接口硬件时,我遇到了一些航天飞机位串行下行链路数据。很久以前就有一篇关于它的NASA技术简报。在每个字节从位流中移入后,我只使用256元素查找表,反转位(表[0x01] = 0x80等)。

答案 2 :(得分:18)

Java中没有无符号整数。所有整数都是以大端语签名的。

  

在C侧,每个字节的开头的LSB在左边,MSB在最后。

听起来你使用LSB作为最不重要的一点,是吗? LSB通常代表最低有效字节。 Endianness不是基于位的,而是基于字节的。

要从无符号字节转换为Java整数:

int i = (int) b & 0xFF;

要从byte []中的无符号32位little-endian转换为Java long(从头顶开始,未经测试):

long l = (long)b[0] & 0xFF;
l += ((long)b[1] & 0xFF) << 8;
l += ((long)b[2] & 0xFF) << 16;
l += ((long)b[3] & 0xFF) << 24;

答案 3 :(得分:11)

这无法影响Java中的任何内容,因为没有(直接的非API)方式将某些字节直接映射到Java中的int。

执行此操作或类似操作的每个API都非常精确地定义了行为,因此您应该查找该API的文档。

答案 4 :(得分:3)

我将逐个读取字节,并将它们组合成 long 值。这样就可以控制字节顺序,并且沟通过程是透明的。

答案 5 :(得分:3)

如果它符合您使用的协议,请考虑使用DataInputStream,其行为为very well defined

答案 6 :(得分:0)

Java是如上所述的“大端”。这意味着如果您检查内存(至少在Intel CPU上),则int的MSB在左侧。对于所有Java整数类型,符号位也在MSB中。
从“ Little-endian”系统存储的二进制文件中读取4字节无符号整数需要用Java进行一些修改。 DataInputStream的readInt()需要Big-endian格式。
这是一个将四个字节的无符号值(如HexEdit显示为01 00 00 00)读为值1的整数的示例:

 // Declare an array of 4 shorts to hold the four unsigned bytes
 short[] tempShort = new short[4];
 for (int b = 0; b < 4; b++) {
    tempShort[b] = (short)dIStream.readUnsignedByte();           
 }
 int curVal = convToInt(tempShort);

 // Pass an array of four shorts which convert from LSB first 
 public int convToInt(short[] sb)
 {
   int answer = sb[0];
   answer += sb[1] << 8;
   answer += sb[2] << 16;
   answer += sb[3] << 24;
   return answer;        
 }

答案 7 :(得分:0)