def max_k_sort(k, nums):
# sort nums first using timsort
# add O(n*log(n)) time complexity
sorted_nums = sorted(nums)
return sorted_nums[-1*k:len(nums)]
def max_k(k, nums):
# build initial max number list
max_nums = {}
# add O(k) time complexity?
i = 0
while i < k:
max_nums[i] = 0
i += 1
# add O(n) time complexity?
least_max_key = min(max_nums, key=max_nums.get)
least_max = max_nums[least_max_key]
# add O(n) time complexity?
for n in nums:
if n > least_max:
max_nums[least_max_key] = n
least_max_key = min(max_nums, key=max_nums.get)
least_max = max_nums[least_max_key]
return max_nums.values()
print(max_k(5, [2, 8, 4, 9, 0, 12, 12, 6, 5]))
我不太清楚这段代码的时间复杂性。任务是从未排序的整数数组返回最大k数。数组中的每个数字都在[0,10000)范围内。我的目标是有一个明显的解决方案max_k_sort(k,nums)以O(n * log(n))时间复杂度完成任务,另一个方法max_k(k,nums)以O(n)时间复杂度完成任务其中n是传递的整数数,k是要查找的最大值数。我不能不知道是否有办法返回以O(n)时间复杂度排序的最大值。
答案 0 :(得分:9)
for n in nums:
if n > least_max:
max_nums[least_max_key] = n
least_max_key = min(max_nums, key=max_nums.get) # this is O(k)
least_max = max_nums[least_max_key]
您正在进行O(k)操作 n 次,因此第二个函数的复杂度为O(n * k)。
假设您希望按排序顺序输出,这可以通过创建 k 大小的堆并将所有内容推送到O(n * log(k))来最轻松地完成。这是在heapq.nlargest
。
import heapq
heapq.nlargest(5, [2, 8, 4, 9, 0, 12, 12, 6, 5])
Out[4]: [12, 12, 9, 8, 6]
如果您不希望按排序顺序输出,则技术上可以在O(n)中完成。 There exist algorithms(和python implementations)以线性时间查找数组中 k 的最大元素;很容易看到,再一次通过数组将允许你构建一个所有数字 k 和更大的数组,给出整体O(n)。
答案 1 :(得分:0)
Python states列表排序中列表操作的时间复杂度为O(N log N)。
切片是O(k)
所以:
def max_k(k, nums):
nums.sort(reverse=True)
return nums[0:k]
O(k)+ O(n log n)是O(n log n)其中O(k)小于O(n log n)
>>> max_k(5, [2, 8, 4, 9, 0, 12, 12, 6, 5])
[12, 12, 9, 8, 6]
实际上,请尝试计时:
import heapq
def max_k1(k, nums):
nums.sort(reverse=True)
return nums[0:k]
def max_k2(k, nums):
return heapq.nlargest(k, nums)
if __name__ == '__main__':
import timeit
for f in (max_k1, max_k2):
li=[2, 8, 4, 9, 0, 12, 12, 6, 5]
print f.__name__, timeit.timeit('f(5, li)', setup='from __main__ import f, li')
打印:
max_k1 0.240165948868
max_k2 4.96488595009
因此sort和slice比heapq快20倍。
基于评论:
import heapq
def max_k1(k, nums):
nums.sort(reverse=True)
return nums[0:k]
def max_k2(k, nums):
return heapq.nlargest(k, nums)
def max_k3(k, nums):
return sorted(nums, reverse=True)[0:k]
if __name__ == '__main__':
import timeit
for f in (max_k1, max_k2, max_k3):
li=[2, 8, 4, 9, 0, 12, 12, 6, 5]
print f.__name__, timeit.timeit('f(5, li)', setup='from __main__ import f, li')
max_k1 0.242296934128
max_k2 4.52635192871
max_k3 0.332237005234