Java - 如何检查字符串中的重复字符?

时间:2011-10-28 14:59:44

标签: java regex string function duplicates

我需要编写一个函数来检查字符串是否有重复值,并返回唯一字符的数量。如果计数大于3,则应返回true。如果计数小于3,则应为假。这是我一直在尝试的(注意我是java的新手)

private boolean isFormatValid(String password) {
    CharSequence inputStr = password;
    int length = inputStr.length();
    int numberDups = 0;

    for(int i=0; i < length; ++i) {
        Pattern pattern = Pattern.compile("(.)(?=.*?\1){1,20}");
        Matcher matcher = pattern.matcher(inputStr);
        numberDups += 1;
    }
    if (numberDups < 3) {
        return false;
    }
    return true;
}

我试图使用正则表达式,因为它被认为可能更容易。但如果我能在没有正则表达式的情况下实现这一目标,我会更快乐。

这是什么意思?

private boolean isFormatValid(String password) {
    int length = inputStr.length();
    int numberChars = 0;

    for(int i=0; i < length; ++i) {
                int index = password.indexOf(i);
        CharArray[i] = charAt(i);   
    }
}

我觉得这甚至不是正确的......

3 个答案:

答案 0 :(得分:6)

你几乎就在那里。您可以使用索引i索引String并使用charAt(int)读取特定字符,而不是使用正则表达式。

然后,您需要一个数据结构来跟踪每个角色的出现次数。我建议使用HashMap,因为地图键是您已阅读的Character,地图值是发生次数的Integer计数。

答案 1 :(得分:3)

算法非常简单:

  1. 将字符串拆分为字符数组
  2. 将所有这些字符添加到Set(HashSet)。
  3. 之后,您的集合仅包含唯一字符。

答案 2 :(得分:1)

我认为示例代码中的变量numberDups名称错误,这让一些人感到困惑。该变量应该代表不同字符的数量,不是吗?也就是说,如果字符串为abcabc,则数字为3,而对于字符串aaaaaaaaa,则为1

在这种情况下,正如其他人所说,最简单的解决方案是使用Set。事实上你的代码几乎就在那里;只需摆脱numberDups计数器并将其替换为HashSet<Character>,如下所示:

static boolean isFormatValid(String password) {
    CharSequence inputStr = password;
    int length = inputStr.length();
    Set<Character> uniqueChars = new HashSet<Character>();

    for(int i=0; i < length; ++i) {
        uniqueChars.add(inputStr.charAt(i));
    }

    return uniqueChars.size() >= 3;
}

(但是,您不需要创建inputStr变量。您可以在charAt()变量上调用length()password等CharSequence方法,因为{{1实现String接口。)


编辑:我还想指出,您使用模式和匹配器的方式,使用它们。你从Pattern中正确地创建了Matcher,并将它与输入字符串相关联,但它只是坐在那里。要应用正则表达式,您必须调用其中一种方法CharSequencefind()(或matches(),但没有人使用过该方法)。

这是一个非常常见的初学者的错误。 Java无论如何都有过于冗长的声誉,但在这种情况下,它尤其引人注目(并且令人惊讶)。我的意思是,什么是正则表达式,如果没有让你解决问题没有编写大量的代码?但它并不总是那么糟糕;这是使用正则表达式的单行解决方案:

lookingAt()

即删除所有重复项,结果字符串的长度与唯一字符数相同。但是,基于集合的解决方案仍然更简单;这个只是更短。