插入排序 - 最佳/平均分析

时间:2016-12-18 08:37:02

标签: algorithm sorting insertion-sort

在引用Sedgewick教授的插入排序lecture时,

我了解到了,

  

Proposition:要对具有不同键的随机排序数组进行排序,插入排序平均使用〜(1/4)N ^ 2比较和〜(1/4)N ^ 2交换。

我也了解到了,

  

最佳情况 - 如果数组按升序排列,则插入排序会进行N-1比较和零交换

如果我分析伪代码,

int n = array.length;
for(int i=0; i < n; i++){
  for(int j=i; j>0; j--){
    if(less(a[j], a[j-1]))
      swap(array, j, j-1);
    else
      break; // Is N^2/4 due to break statement?
  }
} 

问题:

所以,

由于break语句以避免进一步比较,插入排序在平均情况下执行(N ^ 2)/ 4比较,并且在最佳情况下进行N-1比较。

我的理解是否正确?

1 个答案:

答案 0 :(得分:1)

需要多一点数学。

您是否意识到插入排序执行的交换次数恰好是输入中存在的反转次数?

反转:如果i<j but a[i]>a[j],则索引对(i,j)是反转。

So I(i,j) = 1 if (i,j) is inversion
          = 0 if (i,J) is not an inversion

Now you have to get the expectation of this to get the average case
E[I]= Sum(E[I_{i,j}) = Sum over i and j such that i<j [(1/2)]= 1/2*nC2=n*(n-1)/2*1/2~n^2/4

Why E[I_(i,j)]=1/2?
    E[I_(i,j)]=P(I_(i,j)=1)*I_(i,j)+P(I_(i,j)=0)*I_(i,j)
              = 1/2*1+1/2*0
              = 1/2

i有多少指数

1 2 3 4 .. n
For 1 there is 0 such indices
For 2 there is 1 such index [1]
For 3 there is 2 such index [1,2]
..
For n there is 1 such index [1,2,..n-1]
So total = 0+1+2..+n-1= n*(n-1)/2 

顺便说一下,我猜你知道这个...但仍然。为什么1 + 2 + .. n-1 = n *(n-1)/ 2

Let the sum be S= 1+2+3+...+n-1
               S= n-1+n-2+....1
            -----------------------
              2*S= (n-1+1)+(n-2+2)...(1+n-1)
                 = n *n*n...n-1 times
                 = n*(n-1)
            So S = n*(n-1)/2