在MATLAB上堆排序应该是非常慢吗?

时间:2016-02-08 06:52:09

标签: algorithm matlab sorting heapsort clrs

我在MATLAB中编写了一个堆排序函数,它工作正常,只是当输入的长度大于或等于1000时,它可能需要长时间(例如1000长度需要半秒钟)。我不确定是不是MATLAB在堆排序算法上运行得不是很快,或者只是我的代码需要改进。 我的代码如下所示:

function b = heapsort(a)

[~,n] = size(a);
b = zeros(1,n);
for i = 1:n
    a = build_max_heap(a);
    b(n+1-i) = a(1);

    temp = a(1);
    a(1) = a(n+1-i);
    a(n+1-i) = temp;

    a(n+1-i) = [];
    a = heapify(a,1);
end
end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

function a = build_max_heap(a)
[~,n] = size(a);
m = floor(n/2);
for i = m:-1:1
    a = heapify(a,i);
end
end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

function a = heapify(a,i)
[~,n] = size(a);

left = 2*i;
right = 2*i + 1;

if left <= n 
    if a(left) >= a(i)
        large = left;
    else
        large = i;
    end
else
    return
end
if right <= n
    if a(right) >= a(large)
        large = right;
    end
end

if large ~= i
    temp = a(large);
    a(large) = a(i);
    a(i) = temp;
    a = heapify(a,large);
end
end

我知道可能是代码a(n+1-i) = [];可能会耗费大量时间。但是,当我将[]更改为-999(低于任意数量的输入向量)时,它无助于拍摄更多时间。

1 个答案:

答案 0 :(得分:4)

您应该使用profiler来检查占用时间最多的行。它绝对是a(n+1-i) = [];,这会降低你的功能。

在循环中调整数组大小非常慢,所以你应该总是试图避免它。

一个简单的测试:

  • 创建一个以大向量作为输入的函数,并迭代删除元素,直到它为空。
  • 创建一个与输入相同的矢量并将每个值迭代设置为0InfNaN或其他内容的函数。

使用timeit检查哪个功能更快。您将看到最后一个函数的速度大约快100倍(当然,取决于矢量的大小)。

-999花费更多时间的原因很可能是因为a不再变得越来越小,因此a = heapify(a,1);不会变得越来越快。我还没有对它进行测试,但是如果你在第一个函数中尝试以下内容,你可能会得到一个更快的程序(你必须在你的代码中插入n+1-i)个其他地方,但我和#39;留给你):

a(n+1-ii) = NaN;
a(1:n+1-ii) = heapify(a(1:n+1-ii),1);

请注意,我将i更改为ii。这部分是因为我想给你一个很好的建议,部分是为了避免被提醒not use i and j as variables in MATLAB