我的序列化机制有什么问题?

时间:2010-10-13 15:47:15

标签: java

这是在Mac OS(JDK 1.6)上正常运行的代码:

String s1 = "test";
ByteArrayInputStream in = new ByteArrayInputStream(s.getBytes());
String s2 = (String)(new ObjectInputStream(in).readObject());

在Linux CentOS 5.4上Java说:

java.io.StreamCorruptedException: invalid stream header: 3F3F0005
at java.io.ObjectInputStream.readStreamHeader(ObjectInputStream.java:783)
at java.io.ObjectInputStream.<init>(ObjectInputStream.java:280)
at com.XXX.SerializableTest.testWorks(SerializableTest.java:26)
[...]

它是什么?

1 个答案:

答案 0 :(得分:12)

ObjectInputStream仅适用于ObjectOutputStream撰写的数据。

getBytes()的{​​{1}}方法不是Java序列化机制;它只是使用您平台的默认字符编码对字符串进行编码。


对于大多数应用程序,使用无参数String方法是一个坏主意。正如我所说,它使用它运行的平台的默认编码。如果结果将在不同的机器上使用,则可能会中断。

对于大多数应用程序,您应该明确指定要使用的字符编码。

重要的是要记住某些字节编码在某些字符编码中无效。如果要将任意字节序列转换为字符串,请选择一个为每个字节值分配单个字符的编码(如果有这样的东西;我熟悉的常见字符不使用每个字节)

我猜测,而不是getBytes(),有问题的字符串是这样创建的:

"test"

相反,最后一行应该如下所示,其中ByteArrayOutputStream buf = ByteArrayOutputStream(); ObjectOutputStream oos = new ObjectOutputStream(buf); oos.writeObject(x); oos.flush(); oos.close(); /* BAD! you should specify encoding! */ String encoded = new String(buf.toByteArray()); 是一个合适的字符编码,如上所述:

encoding

然而,更好的技术是使用专门用于将“二进制”数据表示为文本的编码。 Base-64受到广泛支持。 Base-85更紧凑,但并不普遍。您需要第三方库来执行这些编码之一。 (Base-64在Sun [Oracle]运行时实现,但它不是公共API的一部分。)