应用错误收集

“查找具有k个唯一字符的最长子字符串”的时间复杂度？

时间：2018-04-03 19:57:26

标签： python string algorithm dynamic-programming

我正在使用名为“查找带有K个唯一字符的最长子字符串”的算法问题。以字符串“aabbccdd”为例。如果K为1，则最长的子串可以是“aa”。如果K是2，则最长的子串可以是“aabb”。如果K为3，则最长的子串可以是“aabbcc”。

这个问题，你可以利用滑动窗口。使用开始指针和结束指针来表示滑动窗口中的子字符串，如果当前子字符串具有K个唯一字符或更少，则表示该字符串可能更长，您只需要将结束指针向前移动一个字符。

如果在向前移动结束指针后当前子字符串超过K个唯一字符，则表示前一个子字符串是具有K个唯一字符的潜在候选字符。在这种情况下，您只需要向前移动开始指针，直到当前子字符串具有K个或更少的唯一字符。

我不明白为什么时间复杂度是线性的。从表面看，它似乎是二次的。我们有两个指针。指针我可能是一个线性扫描。 j通过线性扫描保持固定。所以这对我来说似乎是二次方的。

TLDR：有人可以清楚地推断出我的线性时间复杂度吗？这对我来说并不明显。我喜欢滑动窗口的概念，隐含地遍历N ^ 2个子串。然后利用问题的属性来设置起点和终点，以尝试使其成为线性。但我不知道这是如何线性的。这在我的分析中看起来是二次的

2 个答案:

答案 0 :(得分：2)

为了解决时间复杂性问题，总是有助于扩大问题并考虑大量案例。

如果您的字符串长达数千个字符，我们仍然只有一个开始指针和一个结束指针。关键是两个指针只会向前移动（沿着字符串）。因此，这种复杂性肯定是O(n)，因为它们只是通过字符串一起向前移动 - 所以这个过程所花费的时间与字符串的长度（到达结尾所需的时间）成正比

如果我们要检查从开始指针到字符串结尾的结束指针的所有窗口，然后再增加开始指针并再次检查所有这些子字符串，则会出现O(n^2)的时间复杂度（从开始指针到字符串的结尾）。在这里，我们看到当我们使用开始指针（O(n)）迭代字符串时，每次迭代都涉及自己的嵌套迭代，将结束指针移动到字符串的末尾。这会使复杂性O(n^2)。

然而，如前所述，您的指针只会前进，所以最多只有O(n)复杂度。

答案 1 :(得分：2)

算法为O(n)意味着操作数最终受某些线性函数a * n的限制，其中a是常量。

对于依赖于列表遍历的算法，并不意味着它们必须只遍历列表一次。这意味着他们必须最多a次遍历列表，并且a不依赖于列表长度。

在你的情况下，你有两个指针，但它们每个只遍历列表一次。这意味着您始终只遍历列表两次。

还有一点需要注意的是，虽然n字符串中的子字符串数量增长O(n^2)，但您并没有遍历所有子字符串。事实上，只有n只有它们是有效的，而这些是你用双指针遍历检查的唯一的。

例如，在带有'abcdef'的字符串k = 3中，您不会检查子字符串'abcd'。