我有二进制格式的数据(hex: 80 3b c8 87 0a 89
),我需要将其转换为String,以便通过Jackcess在MS Access数据库中保存二进制数据。我知道,我不认为在Java中使用String来获取二进制数据,但Access db是第三方产品,我无法控制。
所以我尝试转换二进制数据并保存,但遗憾的是结果出乎意料。
byte[] byteArray = new byte[] {0x80, 0x3b, 0xc8, 0x87, 0x0a 0x89};
System.out.println(String.format("%02X ",byteArray[0])+String.format("%02X ", byteArray[1]));//gives me the same values
String value = new String(byteArray, "UTF-8");//or any other encoding
System.out.println(value);//completely different values
我想知道new String
下发生了什么,以及是否有办法将二进制数据转换为字符串并具有相同的十六进制值。
注1 :最初我读了一个与hex无关的二进制文件。我只使用hex来比较数据集。
注意2 有人建议使用Base64 aka MIME,UTF-7等。根据我的理解,它采用二进制数据并将其编码为ANSI字符集,基本上调整初始数据。但是,对我来说这不是一个解决方案,因为我必须写出我在二进制数组中保存的确切数据。
byte[] byteArray = new byte[]{0x2f, 0x7a, 0x2d, 0x28};
byte[] bytesEncoded = Base64.encodeBase64(byteArray);
System.out.println("encoded value is " + new String(bytesEncoded ));//new data
答案 0 :(得分:4)
为了安全地将任意二进制数据转换为文本,您应该使用hex或base64之类的东西。诸如UTF-8之类的编码意味着将任意文本数据编码为字节,而不是将任意二进制数据编码为文本。这与源数据的区别在于。
我强烈建议您使用库。例如,使用Guava:
String hex = BaseEncoding.base16().encode(byteArray);
// Store hex in the database in the text field...
...
// Get hex from the database from the text field...
byte[] binary = BaseEncoding.base16().decode(hex);
(其他库当然可用,例如Apache Commons Codec。)
或者,将二进制数据保存到Access中的字段中,设计用于二进制数据,而不是将其转换为文本。
答案 1 :(得分:1)
要采取的基本教训 - 永远不要将二进制数据与等效的字符串混淆。
我的错误是,我将初始数据从Access导出到csv,同时将索引字段的类型从二进制文件更改为String(总是很糟糕,现在我知道)。我来的解决方案 - 我自己的Access导出工具,所有数据都保存为二进制。感谢@ gord-thompson - 他的评论导致了解决方案。