在log(n)时间内查找经常出现的字母?

时间:2015-04-02 16:30:17

标签: java c++ string letter

如果给出一个字符串,例如" aaabbccc",你会如何输出' a'因为它的发生频率与' c'但首先发生。

我是用O(n)时间做的,但我无法用log(n)时间来判断你是怎么做的,无论是在java还是c ++中。

编辑: 这是一个面试问题。

#include <iostream>
#include <string>
using std::string;
using std::cout;
using std::cin;
using std::endl;

char findFreqChar(string str) {
    int count;
    int maxOccur = 0;
    char maxChar;
    for (char i = 'A'; i < 'z'; i++) {
        count = 0;

        for (int j = 0; j < str.length(); j++) {
            if (i == str[j])
                count++;
        }
        if (count > maxOccur) {
            maxOccur = count;
            maxChar = i;
        }
    }
    return maxChar;
}
int main() {
    std::cout << "Enter String: ";
    std::string str;
    std::getline(std::cin, str);
    cout << findFreqChar(str);
    cin.get();
}

3 个答案:

答案 0 :(得分:2)

无法在O(n)时间内找到最常用的字母,因为如果没有检查字符串中的每个字符,就无法确定该信息!

答案 1 :(得分:0)

如果您可以保证字母已排序,如您的示例所示,那么您可以使用二进制搜索来识别每个连续字母范围的末尾。 每个二进制搜索都是log(n);在最坏的情况下,你需要做25个才能找到所有的边界但是“25 x constant x log(n)”仍然是O(log(n))我想。

如果采用二分搜索方法,那么可以巧妙地做到这一点 - 当相同二进制搜索中的连续测试返回相同的字母并因此假设为最小范围大小时,发现短于任何可能的范围那 - 但你可能会更好地使用单独的搜索进行编码。或者最好只采取O(n)扫描解决方案:你真的需要这样做O(log(n))吗?

答案 2 :(得分:0)

如果您需要在O(log(n))时间内完成此操作,那么这表明您需要开发某种类型的分而治之算法。我假设(基于你给我们的例子),所有出现的一个字母都是连续的。因此,我们可以做到以下几点:

1)将数组分成两半并递归调用算法。子算法必须返回4个值:      - 阵列中出现的最常见值及其频率      - 以最右边的字符结尾的连续字符数      - 以最左边的字符结尾的连续字符数

因此,对“aabbbbcc”调用时的递归调用将返回:         (b,4,2,2)

2)合并两个子数组并返回(现在更大的数组)的结果。首先,我们需要计算组合数组中最常见的字符。这很容易计算为右边最长的序列,左边最长的序列,或跨越分裂点的序列(这就是我们需要递归调用的最后2个值的原因)。这一切都可以在恒定的时间内完成。我们还从两个递归调用中返回适当的值,以获得以最右边和最左边字符结尾的连续字符的长度。

这种递归以T(n)= T(n / 2)+ O(1)或O(lg n)

结束

有很多边界情况需要处理,你需要弄清楚当递归“底部”时如何处理,但这应该足以让你编写代码。