压缩字符串和符号

时间:2012-10-03 07:18:40

标签: java android string encoding compression

我有大约200个字符的字符串,包括字符和符号 我想使用任何算法来压缩这个字符串......

请帮助我任何类型的程序,代码,algortihms

提前致谢

目前我正在使用它,但是当符号存在时,它会显示数组索引超出范围。

**COMPRESSION**
byte[] encode(String txt, int bit){
int length = txt.length();
float tmpRet1=0,tmpRet2=0;
if(bit==6){
    tmpRet1=3.0f;
    tmpRet2=4.0f;
}else if(bit==5){
    tmpRet1=5.0f;
    tmpRet2=8.0f;
}
byte encoded[]=new byte[(int)(tmpRet1*Math.ceil(length/tmpRet2))];
char str[]=new char[length];
txt.getChars(0,length,str,0);
int chaVal = 0;
String temp;
String strBinary = new String("");
for (int i = 0;i<length; i++){
    temp = Integer.toBinaryString(toValue(str[i]));
    while(temp.length()%bit != 0){
        temp="0"+temp;
    }
    strBinary=strBinary+temp;
}
while(strBinary.length()%8 != 0){
   strBinary=strBinary+"0";
}
Integer tempInt =new Integer(0);
for(int i=0 ; i<strBinary.length();i=i+8){
    tempInt = tempInt.valueOf(strBinary.substring(i,i+8),2);
    encoded[i/8]=tempInt.byteValue();
}
return encoded;
}



**DECOMPRESSION** :

String decode(byte[] encoded, int bit){
String strTemp = new String("");
String strBinary = new String("");
String strText = new String("");
Integer tempInt =new Integer(0);
int intTemp=0;
for(int i = 0;i<encoded.length;i++){         
    if(encoded[i]<0){
        intTemp = (int)encoded[i]+256;
    }else
        intTemp = (int)encoded[i];
    strTemp = Integer.toBinaryString(intTemp);
    while(strTemp.length()%8 != 0){
        strTemp="0"+strTemp;
    }
    strBinary = strBinary+strTemp;
}
for(int i=0 ; i<strBinary.length();i=i+bit){
    tempInt = tempInt.valueOf(strBinary.substring(i,i+bit),2);
    strText = strText + toChar(tempInt.intValue()); 
}
return strText;
}

2 个答案:

答案 0 :(得分:1)

有一次,在我学习的时候,我的老师让我编写了一个文本压缩器(很酷的家庭作业)。 基本思想是:如果每个字符都是8位,找到最常出现的字符并为它们分配一个较短的值,同时为看起来较少的字母分配一个较大的值。

示例:

A = 01010101 B = 10101010

Uncompressed: AAAB - 01010101 01010101 01010101 10101010

Compressed:

A出现3次(应该有较短的表示) B出现1次(应该有更长的代表性)

A - 01

B - 10

Result: 01 01 01 10

因此,您为每个字母生成一系列位,其方式是任何字母都不应具有可与另一个字母匹配的表示。然后将生成的方案存储在压缩文件中。 如果你想要解压缩,只需从压缩文件中读取方案,然后开始读取bit-a-bit。

在此查看详细信息:http://web.stonehill.edu/compsci//LC/TEXTCOMPRESSION.htm

答案 1 :(得分:0)

您可以使用GZIPOutputStream压缩GZIPInputStream进行解压缩。

如果你想在内存中这样做,只需使用ByteArrayInputStream / ByteArrayOutputStream作为上述两个类的目标。

请参阅下面的链接:

http://docs.oracle.com/javase/1.5.0/docs/api/java/util/zip/GZIPOutputStream.html