我的问题来自发布到How to find the missing numbers in an arbitrary list in python 3?的答案。
大多数解决方案建议使用类似于
的方法a = [10,12,13,8]
# get set of full numbers
allNums = set( (x for x in range(min(a),max(a)+1)))
# do some kind of set operation / symetric difference
这需要进行两次a
迭代才能从列表中获取min(a)
和max(a)
作为值,以建立包含min(a)
和{{1}之间的所有数字的范围}。
很容易将其简化为max(a)
的一遍:
a
可以在O(n)时间和恒定空间中进行检索。
是否可以使用python中的内置/模块来做到这一点?
编辑: 同意:min()和max()都也是O(n),但是使用了两次(该常数是常数,并且减少为O(n)-是的),但是两次执行一次却仍然比较慢。>
使用一些基准测试进行编辑:
def minmax(data):
"""Get the min and max of an iterable in O(n) time and constant space."""
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
minValue = d if d < minValue else minValue
maxValue = d if d > maxValue else maxValue
return (minValue,maxValue)
import timeit
# 100k random numbers to min/max upon
data = """import random
random.seed(42)
data = random.choices(range(1000000),k=100000)"""
最小/最大使用量
t1 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
import functools
def minmax(aa):
return functools.reduce(lambda mm,xx : ( min(mm[0],xx),max(mm[1],xx)) , aa, ( aa[0],aa[0],))
""" + data, number = 1000 )
尝试通过if / elif进行比较:
t2 = timeit.timeit("""
mi,ma=min(data),max(data)
""",setup=data, number = 1000)
不带if / elif的一次通过尝试(需要更多比较):
t3 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
def minmax(data):
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
if d < minValue: # changed to if / elif: in a vain attempt to make it faster
minValue = d # its closer to the proposed solution in the numpy-question
elif d > maxValue: # linked above
maxValue = d
return (minValue,maxValue)
""" + data, number = 1000)
导致的原因:
t4 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
def minmax(data):
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
minValue = d if d < minValue else minValue
maxValue = d if d > maxValue else maxValue
return (minValue,maxValue)
""" + data, number = 1000)
答案 0 :(得分:1)
您可以使用functools.reduce
import functools
def minmax(aa):
return functools.reduce(lambda mm,xx : ( min(mm[0],xx),max(mm[1],xx)) , aa, ( aa[0],aa[0],))
print(minmax([10,25,5,100,12,32])) # print (5, 100)