应用错误收集

为什么我们使用字节来读取二进制数据

时间：2013-11-04 09:04:16

标签： java

我们使用java原语'byte'来读取和写入二进制文件，如fileInputStream.read(byte)等。在更多示例中，我们看到byte[] = String.getBytes()。一个字节只是8位值。为什么我们使用byte[]来读取二进制文件？从文件或字符串读取后，字节值包含什么？

3 个答案:

答案 0 :(得分：5)

我们使用java原语'byte'来读写二进制文件，如fileInputStream.read(byte)等。

因为操作系统将文件建模为字节序列（或更确切地说，为八位字节）。 byte类型是Java中八位字节的最自然表示。

为什么我们使用byte []来读取二进制文件？

和以前一样的答案。实际上，您也可以通过其他方式读取二进制文件;例如使用DataInputStream。

从文件或字符串读取后，字节值包含什么？

在第一种情况下，文件中的字节。

在第二种情况下，您不会从字符串中“读取”字节。相反，当您调用String.getBytes()时，如果在特定字符集中编码，则会获得包含字符串字符的字节。如果使用no-args getBytes()方法，您将获得JVM的默认字符集/编码。您还可以提供参数以选择不同的编码。

Java明确区分字节（8位）数量和字符。从概念上讲，Java字符是Unicode代码点，字符串和类似的文本表示是字符序列...而不是字节序列。

（不幸的是，实现中存在“皱纹”。当设计Java时，Unicode字符空间适合16位;即有<= 65536个可识别的代码点.Java旨在匹配此... 。char类型被定义为16位无符号整数类型。然后Unicode被扩展到> 65536个代码点，而Java留下了一些难以解决的问题，即一些Unicode代码点无法使用一个char值。相反，它们由一对char值表示......一个所谓的代理对 ...而Java字符串有效地用UTF表示 - 16.对于大多数常见的字符/字符集，这没关系。但是如果你需要处理不寻常的字符/字符集，正确的处理字符串的方法是使用“ codepoint“方法。”

答案 1 :(得分：2)

String是基于字节构建的。字节是基于位构建的。这些位“物理地”存储在驱动器上。

因此，不是逐位读取驱动器中的数据，而是以更大的部分读取，这些部分是字节。

所以byte []包含原始数据。原始数据等于存储在驱动器上的数据。

你最终alaways读取原始数据，然后你可以应用格式化程序将字节转换为字符，最终成为熨平板上显示的字母（如果是txt文件）。如果你死了图像输出将读取存储有关字符颜色的信息的字节。

答案 2 :(得分：-1)

因为最小的存储单元是字节。