我想在java中解压缩一个字符串,这是在python中压缩的gzip。
通常,我在python中对压缩字符串使用base64编码,然后在java中执行解压缩之前解码该压缩字符串。这在使用base64编码时工作正常。
但是有没有办法解压缩java中的字符串,这是在python中压缩的gzip而不使用base64编码。
实际上,我想将压缩的二进制数据http发布到二进制数据被解压缩的服务器上。在python和服务器端完成压缩和http post是java。
我在python中尝试了没有base64编码的代码,并在java中使用缓冲读取器读取,然后使用getBytes()将读取的压缩字符串转换为byte [],并将其提供给GZIPInputStream进行解压缩。但这引发了一个例外:
java.io.IOException: Not in GZIP format at
java.util.zip.GZIPInputStream.readHeader(GZIPInputStream.java:154)
at java.util.zip.GZIPInputStream.<init>(GZIPInputStream.java:75)
at java.util.zip.GZIPInputStream.<init>(GZIPInputStream.java:85)
at GZipFile.gunzipIt(GZipFile.java:58)
at GZipFile.main(GZipFile.java:42)
请给我一个解决方案,无需任何编码即可执行压缩和解压缩。有没有办法在python中的http post中发送二进制数据?
这是python中的压缩代码:
import StringIO
import gzip
import base64
import os
m='hello'+'\r\n'+'world'
out = StringIO.StringIO()
with gzip.GzipFile(fileobj=out, mode="wb") as f:
f.write(m)
f=open('comp_dump','wb')
f.write(base64.b64encode(out.getvalue()))
f.close()
这是java中的解压缩代码:
//$Id$
import java.io.*;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.zip.GZIPInputStream;
import javax.xml.bind.DatatypeConverter;
import java.util.Arrays;
public class GZipFile
{
public static String readCompressedData()throws Exception
{
String compressedStr ="";
String nextLine;
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("comp_dump")));
try
{
while((nextLine=reader.readLine())!=null)
{
compressedStr += nextLine;
}
}
finally
{
reader.close();
}
return compressedStr;
}
public static void main( String[] args ) throws Exception
{
GZipFile gZip = new GZipFile();
byte[] contentInBytes = DatatypeConverter.parseBase64Binary(readCompressedData());
String decomp = gZip.gunzipIt(contentInBytes);
System.out.println(decomp);
}
/**
* GunZip it
*/
public static String gunzipIt(final byte[] compressed){
byte[] buffer = new byte[1024];
StringBuilder decomp = new StringBuilder() ;
try{
GZIPInputStream gzis = new GZIPInputStream(new ByteArrayInputStream(compressed));
int len;
while ((len = gzis.read(buffer)) > 0) {
decomp.append(new String(buffer, 0, len));
}
gzis.close();
}catch(IOException ex){
ex.printStackTrace();
}
return decomp.toString();
}
}
答案 0 :(得分:0)
并非每个byte []都可以转换为字符串,并且转换回来 可以给其他字节。
请在压缩时明确定义编码,并在解压缩时执行相同操作。否则,您的OS
,JVM
等...将为您完成。并且可能会搞砸它。
例如:在我的Linux机器上:
的Python
import sys
print sys.getdefaultencoding()
>> ascii
爪哇
System.out.println(Charset.defaultCharset());
>> UTF-8