我在MATLAB中编写了一个堆排序函数,它工作正常,只是当输入的长度大于或等于1000时,它可能需要长时间(例如1000长度需要半秒钟)。我不确定是不是MATLAB在堆排序算法上运行得不是很快,或者只是我的代码需要改进。 我的代码如下所示:
function b = heapsort(a)
[~,n] = size(a);
b = zeros(1,n);
for i = 1:n
a = build_max_heap(a);
b(n+1-i) = a(1);
temp = a(1);
a(1) = a(n+1-i);
a(n+1-i) = temp;
a(n+1-i) = [];
a = heapify(a,1);
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function a = build_max_heap(a)
[~,n] = size(a);
m = floor(n/2);
for i = m:-1:1
a = heapify(a,i);
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function a = heapify(a,i)
[~,n] = size(a);
left = 2*i;
right = 2*i + 1;
if left <= n
if a(left) >= a(i)
large = left;
else
large = i;
end
else
return
end
if right <= n
if a(right) >= a(large)
large = right;
end
end
if large ~= i
temp = a(large);
a(large) = a(i);
a(i) = temp;
a = heapify(a,large);
end
end
我知道可能是代码a(n+1-i) = [];
可能会耗费大量时间。但是,当我将[]
更改为-999
(低于任意数量的输入向量)时,它无助于拍摄更多时间。
答案 0 :(得分:4)
您应该使用profiler
来检查占用时间最多的行。它绝对是a(n+1-i) = [];
,这会降低你的功能。
在循环中调整数组大小非常慢,所以你应该总是试图避免它。
一个简单的测试:
0
,Inf
,NaN
或其他内容的函数。使用timeit
检查哪个功能更快。您将看到最后一个函数的速度大约快100倍(当然,取决于矢量的大小)。
-999
花费更多时间的原因很可能是因为a
不再变得越来越小,因此a = heapify(a,1);
不会变得越来越快。我还没有对它进行测试,但是如果你在第一个函数中尝试以下内容,你可能会得到一个更快的程序(你必须在你的代码中插入n+1-i)
个其他地方,但我和#39;留给你):
a(n+1-ii) = NaN;
a(1:n+1-ii) = heapify(a(1:n+1-ii),1);
请注意,我将i
更改为ii
。这部分是因为我想给你一个很好的建议,部分是为了避免被提醒not use i
and j
as variables in MATLAB。