我有大约200个字符的字符串,包括字符和符号 我想使用任何算法来压缩这个字符串......
请帮助我任何类型的程序,代码,algortihms
提前致谢
目前我正在使用它,但是当符号存在时,它会显示数组索引超出范围。
**COMPRESSION**
byte[] encode(String txt, int bit){
int length = txt.length();
float tmpRet1=0,tmpRet2=0;
if(bit==6){
tmpRet1=3.0f;
tmpRet2=4.0f;
}else if(bit==5){
tmpRet1=5.0f;
tmpRet2=8.0f;
}
byte encoded[]=new byte[(int)(tmpRet1*Math.ceil(length/tmpRet2))];
char str[]=new char[length];
txt.getChars(0,length,str,0);
int chaVal = 0;
String temp;
String strBinary = new String("");
for (int i = 0;i<length; i++){
temp = Integer.toBinaryString(toValue(str[i]));
while(temp.length()%bit != 0){
temp="0"+temp;
}
strBinary=strBinary+temp;
}
while(strBinary.length()%8 != 0){
strBinary=strBinary+"0";
}
Integer tempInt =new Integer(0);
for(int i=0 ; i<strBinary.length();i=i+8){
tempInt = tempInt.valueOf(strBinary.substring(i,i+8),2);
encoded[i/8]=tempInt.byteValue();
}
return encoded;
}
**DECOMPRESSION** :
String decode(byte[] encoded, int bit){
String strTemp = new String("");
String strBinary = new String("");
String strText = new String("");
Integer tempInt =new Integer(0);
int intTemp=0;
for(int i = 0;i<encoded.length;i++){
if(encoded[i]<0){
intTemp = (int)encoded[i]+256;
}else
intTemp = (int)encoded[i];
strTemp = Integer.toBinaryString(intTemp);
while(strTemp.length()%8 != 0){
strTemp="0"+strTemp;
}
strBinary = strBinary+strTemp;
}
for(int i=0 ; i<strBinary.length();i=i+bit){
tempInt = tempInt.valueOf(strBinary.substring(i,i+bit),2);
strText = strText + toChar(tempInt.intValue());
}
return strText;
}
答案 0 :(得分:1)
有一次,在我学习的时候,我的老师让我编写了一个文本压缩器(很酷的家庭作业)。 基本思想是:如果每个字符都是8位,找到最常出现的字符并为它们分配一个较短的值,同时为看起来较少的字母分配一个较大的值。
示例:
A = 01010101
B = 10101010
Uncompressed: AAAB - 01010101 01010101 01010101 10101010
Compressed:
A出现3次(应该有较短的表示) B出现1次(应该有更长的代表性)
A - 01
B - 10
Result: 01 01 01 10
因此,您为每个字母生成一系列位,其方式是任何字母都不应具有可与另一个字母匹配的表示。然后将生成的方案存储在压缩文件中。 如果你想要解压缩,只需从压缩文件中读取方案,然后开始读取bit-a-bit。
在此查看详细信息:http://web.stonehill.edu/compsci//LC/TEXTCOMPRESSION.htm
答案 1 :(得分:0)
您可以使用GZIPOutputStream压缩GZIPInputStream进行解压缩。
如果你想在内存中这样做,只需使用ByteArrayInputStream / ByteArrayOutputStream作为上述两个类的目标。
请参阅下面的链接:
http://docs.oracle.com/javase/1.5.0/docs/api/java/util/zip/GZIPOutputStream.html