{Java - PriorityQueue}此代码的时间复杂度

时间:2017-10-08 04:52:39

标签: java algorithm time-complexity comparator priority-queue

  

给定一个包含N个点的数组,找到最接近K的点   2D平面中的原点(0,0)。您可以假设K远小于N.   和N非常大。

     

例如:

    given array: (1,0), (3,0), (2,0), K = 2 
        Result = (1,0), (2,0)  
     

(结果应按距离递增)

代码:

import java.util.*;

class CPoint {
    double x;
    double y;
    public CPoint(double x, double y) {
        this.x = x;
        this.y = y;
    }
}

public class KClosest {
    /**
     * @param myList: a list of myList
     * @param k: the number of closest myList
     * @return: the k closest myList
     */
    public static CPoint[] getKNearestPoints(CPoint[] myList, int k) {

        if (k <= 0 || k > myList.length)  return new CPoint[]{};                                
        if (myList == null || myList.length == 0 )  return myList; 

        final CPoint o = new CPoint(0, 0); // origin point

        // use a Max-Heap of size k for maintaining K closest points
        PriorityQueue<CPoint> pq = new PriorityQueue<CPoint> (k, new Comparator<CPoint> () {
            @Override
            public int compare(CPoint a, CPoint b) {
                return Double.compare(distance(b, o), distance(a, o));  
            }
        });

        for (CPoint p : myList) {   // Line 33
            // Keep adding the distance value until heap is full. // Line 34
            pq.offer(p);            // Line 35
            // If it is full        // Line 36
            if (pq.size() > k) {    // Line 37
                // Then remove the first element having the largest distance in PQ.// Line 38
                pq.poll();          // Line 39  
            }  // Line 40
        }       
        CPoint[] res = new CPoint[k];
        // Then make a second pass to get k closest points into result. 
        while (!pq.isEmpty()) {     // Line 44
            res[--k] = pq.poll();   // Line 45                   
        }                           // Line 46

        return res;
    }

    private static double distance(CPoint a, CPoint b) {        
        return (a.x - b.x) * (a.x - b.x) + (a.y - b.y) * (a.y - b.y);
    }

}

问题:

  
      
  1. 第35行第39行的时间复杂度是独立的   分别?

  2.   
  3. 第35-40行(整体而言)的时间复杂度是什么?

  4.   
  5. 第44-46行(整体而言)的时间复杂度是什么?

  6.   
  7. 整个方法getKNearestPoints()的整体时间复杂度是什么,最佳,最差和平均情况?如果n&gt;&gt;该怎么办? k?   如果我们没有&gt;&gt; k?

  8.   

实际上这些问题在我的技术面试中有几个问题,但我仍然对此感到困惑。任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:4)

从它的外观来看,我认为编写此代码的人必须知道这些问题的答案。

无论如何,此处的Priority Queue基于Max Heap实现。

所以,复杂性如下:

第35行 - O(log k)在堆中插入元素的时间。在插入时堆中遵循自下而上的方法。

第37行 - O(1),检查堆大小的时间,通常是与堆一起维护的。

第39行 - O(log k),删除堆头部的时间,堆根部的 heapify 方法将被删除堆顶。

第35-40行:从上述复杂性我们可以看出,一次迭代的整体复杂性将为O(log k)。此循环针对n元素运行,因此整体复杂度为O(n log k)

第44-46行:检查堆大小的复杂性再次为O(1),轮询为O(log k)。所以我们正在进行轮询k次。循环的总体复杂性为O(k log k)

整体复杂性将保持O(n log k)

This是研究这个主题的绝佳场所。