Java运行长度编码

时间:2015-04-08 06:29:39

标签: java encoding compression

运行长度编码采用带有重复出现字符的字符串,例如qqqqqWWWWr,并将其转换为5q4Wr。重复出现的字符应该以连续重新出现的次数开头。如果它只出现一次,则不应该以数字开头。

这是我到目前为止所做的,而且我似乎无法让它正常工作:

public class Compress {

    public static void main(String[] args) {
        System.out.print("Enter a string: ");
        String s = IO.readString();

        int currentRunLength = 1;
        String compressedString = "";

        for (int i = 0; i < s.length(); i++) {
            if (i == s.length() - 1){
                if (currentRunLength == 1) {
                compressedString += s.charAt(i);
                break;
                } else {
                compressedString += currentRunLength + s.charAt(i);
                break;
                }
            }
            if (s.charAt(i) == s.charAt(i + 1)) {
                currentRunLength++;
            }
            if (s.charAt(i) != s.charAt(i + 1) && currentRunLength > 1) {
                compressedString += currentRunLength + s.charAt(i);
                currentRunLength = 1;
            }
            if (s.charAt(i) != s.charAt(i + 1) && currentRunLength == 1) {
                compressedString += s.charAt(i);
            }
        }
        IO.outputStringAnswer(compressedString);
    }
}

运行示例

输入字符串:qqqqWWWr

结果:&#34; 117q90Wr&#34;

3 个答案:

答案 0 :(得分:1)

当它是一个体面的算法时,也许你不应该重新发明轮子。我在以下网址找到了Rosetta Code的实现:http://rosettacode.org/wiki/Run-length_encoding#Java

如果原始网址被删除,请重新粘贴:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RunLengthEncoding {
    public static String encode(String source) {
        StringBuffer dest = new StringBuffer();
        for (int i = 0; i < source.length(); i++) {
            int runLength = 1;
            while (i+1 < source.length() && source.charAt(i) == source.charAt(i+1)) {
                runLength++;
                i++;
            }
            dest.append(runLength);
            dest.append(source.charAt(i));
        }
        return dest.toString();
    }

    public static String decode(String source) {
        StringBuffer dest = new StringBuffer();
        Pattern pattern = Pattern.compile("[0-9]+|[a-zA-Z]");
        Matcher matcher = pattern.matcher(source);
        while (matcher.find()) {
            int number = Integer.parseInt(matcher.group());
            matcher.find();
            while (number-- != 0) {
                dest.append(matcher.group());
            }
        }
        return dest.toString();
    }

    public static void main(String[] args) {
        String example = "WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW";
        System.out.println(encode(example));
        System.out.println(decode("1W1B1W1B1W1B1W1B1W1B1W1B1W1B"));
    }
}

答案 1 :(得分:1)

我看到的第一个问题是在这一行:

compressedString += currentRunLength + s.charAt(i);

您要向int添加char。添加前char会投放到int,然后添加的结果会附加到Stringq的{​​{3}}为113. 113 + 4可以解释String - &gt;的开头117

答案 2 :(得分:0)

问题与这一行有关:

compressedString += currentRunLength + s.charAt(i)

这是做int并将其添加到char(这会产生int),然后将其添加到压缩字符串中。

您可以通过此微小更改来解决这个问题,这会将currentRunLength转换为字符串,然后附加char

compressedString += String.valueOf(currentRunLength) + s.charAt(i)