如何从排序列表中选择小于给定整数的元素?

时间:2015-04-30 02:16:03

标签: python list python-3.x

我有一系列素数,例如整数0到1000之间

primes = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997]

我得到了输入

n = int(input())

将数组切片到新数组的最有效方法是什么?数组的最后一个元素将小于n

4 个答案:

答案 0 :(得分:9)

您可以利用primes已经排序的事实,bisect,就像这样

>>> from bisect import bisect
>>> primes[:bisect(primes, n)]

bisect对输入列表进行二进制搜索,并返回小于n的元素的索引。

答案 1 :(得分:5)

你有list,而不是数组。如果您确实需要对列表进行切片并构建新列表,那么无论您如何操作,都需要线性时间。 The answer by thefourtheye可能是你要做的最好的事情:

small_primes = primes[:bisect.bisect(primes, n)]

如果您有NumPy,它知道如何创建看起来像的视图,但实际上是引用而不是复制数据。实际上,如果primesndarray,您可以使用完全相同的代码作为答案的答案,它将是O(日志N)。

small_primes = primes[:bisect.bisect(primes, n)]

如果您只需要迭代“数组”一次而不是将其用作列表,则可以使用惰性迭代器:

small_primes = itertools.takewhile(lambda p: p<n, primes)

现在前期时间成本为0;但是在您使用它时,每个值都会附加一个比较。当然,它比其他任何东西都更节省空间。

实际上,“最有效”在这里不太重要,如果它确实重要你需要测量它,如果你不使用NumPy或在PyPy下运行你的代码,你几乎肯定想要做一个那些在微观优化之前......

答案 2 :(得分:2)

你没有解释为什么你要求“最有效的方式”,或者你的意思(时间?空间?其他什么?),我非常怀疑这是一个值得在任何地方优化的性能瓶颈,但如果是:

你只有168个元素。并且你不会有很多类似的列表,因此空间不太可能相关。同时,对于N = 168以上的线性算法来说,你必须称之为数十亿次 - 但是只有1000个可能的值。所以,只需预先创建一个表:

prime_slices = [[prime for prime in primes if prime < n] for n in range(1000)]

现在,要使素数达到n

prime_slices[n]

那是不变的时间。当然,设置需要O(N ^ 2)时间,但这没什么,因为它只发生一次与节省O(N)工作数十亿次。它需要O(N ^ 2)空间,但实际上这只是一个恒定的15K-ish指针,你几乎可以肯定。

答案 3 :(得分:1)

如果您不再需要完整的素数列表,截断素数可能是最快的方法:

primes[bisect(primes, n):]=[]

但与表现一如既往,如果你愿意,可以测量它。