查找最长的连续子数组(未排序)-Python

时间:2019-04-26 04:53:08

标签: python list

v = [1,2,3,11,5,8,9,10,11,6,4]中的1,2,3以上为连续数字(第一连续集合)。 8,9,10,11是连续数字(第二组,最大的一组)。我如何找到第二套?下面的代码给出了连续的数字:

for i in range(len(v)-1):
    if v[i+1]==v[i]+1:
        if v[i-1]!=v[i]-1:
             print(v[i])
        print(v[i]+1)

Output:1,2,3,8,9,10,11

我当时想使用如下所示的方法,将输出添加到新列表中,然后找出列表的最大值。我想不出将这两个想法结合起来的逻辑。

for i in range(len(v)-1):
    for j in range(i+1,len(v)):
        if v[j]-v[i]  

我查看了这个example,但我认为该解决方案与我正在寻找的解决方案有所不同。预先感谢您的时间和建议。

5 个答案:

答案 0 :(得分:1)

您可以遍历该列表,并继续将该项目添加到可能最长的连续子列表中;如果该项目与子列表的最后一个项目不连续,则开始一个新的项目,并将该子列表分配为新的最长子列表(如果它长于当前最长子列表):

candidate = []
longest = []
for i in v:
    if candidate and candidate[-1] != i - 1:
        if len(candidate) > len(longest):
            longest = candidate
        candidate = []
    candidate.append(i)
if len(candidate) > len(longest):
    longest = candidate

longest变为:

[8, 9, 10, 11]

答案 1 :(得分:0)

您可以使用sliding window缩小大小,并检查所有数字是否都按升序排列:

from itertools import islice

def window(seq, n=2):
    "Returns a sliding window (of width n) over data from the iterable"
    "   s -> (s0,s1,...s[n-1]), (s1,s2,...,sn), ...                   "
    it = iter(seq)
    result = tuple(islice(it, n))
    if len(result) == n:
        yield result
    for elem in it:
        result = result[1:] + (elem,)
        yield result


def longestConsecutiveSeq(s):
  for seq in (window(s, i) for i in range(len(s)-1, 1, -1)):
    for subseq in seq:
      l = list(subseq)
      if all((y-x) == 1 for (x, y) in zip(l, l[1:])):
        return l

print(longestConsecutiveSeq([1,2,3,11,5,8,9,10,11,6,4]))

结果:[8, 9, 10, 11]

此算法将在第一次遇到最大大小的情况时停止。

答案 2 :(得分:0)

您可以使用熊猫:

import pandas as pd

v=[1,2,3,11,5,8,9,10,11,6,4]

s = pd.Series(v)

sgc = s.groupby(s.diff().ne(1).cumsum()).transform('count')

result = s[sgc == sgc.max()].tolist()

result

输出:

[8, 9, 10, 11]

详细信息:

创建一个熊猫系列,使用diff计算与前一个值的差。接下来,使用ne创建一个差值不等于1的布尔序列,然后cumsum将该布尔序列创建组,将对等值都分组在一起。将groupbytransform一起使用,以计算每个记录的组大小。最后,使用布尔索引仅选择系列中部分的数量,其中某个组中的计数等于所有组的最大计数。然后使用tolist转换为数组。

答案 3 :(得分:0)

您非常接近。将当前运行存储为列表,在必要时更新最佳列表,并在中断运行时将其清除。如果最后一个分组出现在列表的末尾,则应注意将其分组。

v = [1,2,3,11,5,8,9,10,11,6,4]
best = []
run = []

for i in range(1, len(v) + 1):
    run.append(v[i-1])

    if i == len(v) or v[i-1] + 1 != v[i]:
        if len(best) < len(run):
            best = run

        run = []

print(best)

输出:

[8, 9, 10, 11]

答案 4 :(得分:0)

您可以使用“ groupby()”函数使用元素及其索引之间的差异来对元素进行分组:

from itertools import groupby

l = [1, 2, 3, 11, 5, 8, 9, 10, 11, 6, 4]

gb = groupby(enumerate(l), lambda x: x[0] - x[1])
max(([i for _, i in g] for _, g in gb), key=len)
# [8, 9, 10, 11]