中位数的中位数

时间:2013-07-10 23:36:11

标签: median

我已阅读顺序统计信息,以便在线性时间O(n)中找到大小为n的数组中的第k个最小(或最大)元素。

需要一步才能找到中位数的中位数。

  1. 将阵列分成[n / 5]个部分。每个部分都有5个元素。
  2. 找出每个部分的中位数。 (我们现在有[n / 5]个数字)
  3. 重复步骤1和2,直到我们只有最后一个号码。 (即递归)
  4. T(n)= T(n / 5)+ O(n) 我们可以得到T(n)= O(n)。

    但是,我们最终得到的数字不是中位数的中位数,而是中位数中位数中位数的中位数,如果我们有一个大数组。

    请考虑一个包含125个元素的数组。

    首先,它分为25个部分,我们找到25个中位数。 然后,我们将这25个数字分成5个部分,找到5个中位数, 最后,我们得到中位数中位数的数字。 (不是中位数的中位数)

    我关心它的原因是,我可以理解,最多有大约3/4 * * n个元素比中位数的中位数更小(或更大)。但是,如果它不是中位数的中位数而是中位数的中位数呢?在更糟糕的情况下,必须有比枢轴更小(或更大)的元素,这意味着枢轴更接近阵列的边界。

    如果我们有一个非常大的阵列,我们发现其中位数中位数为中位数中位数的中位数。在最坏的情况下,我们发现的枢轴仍然非常接近边界,在这种情况下时间复杂度是多少?

    我制作了125个元素的数据集。结果是9?

    0.8 0.9 1 inf inf
    1.8 1.9 2 inf inf
    6.8 6.9 7 inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    
    2.8 2.9 3 inf inf
    3.8 3.9 4 inf inf
    7.8 7.9 8 inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    
    4.8 4.9 5 inf inf
    5.8 5.9 6 inf inf
    8.8 8.9 9 inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    inf inf inf inf inf
    

    其中inf表示数字足够大。

1 个答案:

答案 0 :(得分:3)

让我们用[中位数] * = M 表示你的中位数中位数...

首先,我认为中位数算法的中位数(选择一个好的支点)不是递归的。算法如下:

  1. 拆分5
  2. 组中的元素
  3. 查找每组的中位数
  4. 找出中位数的中位数并将其用作支点。
  5. 中位数的中位数小于3n / 10个元素,大于另外3n / 10个元素,而不是3n / 4个元素。选择中位数后,您有n / 5个数字。中位数的中位数大于/小于这些数字的一半,即n / 10。这些数字中的每一个都是中位数,所以它大于/小于2个数字,给你另外2n / 10个数字。现在总共得到n / 10 + 2n / 10 = 3n / 10个数字。

    要解决您的第二个问题,在您的示例数据集中收集5组并计算其中位数之后,我们将按以下顺序进行:

    1, 2, 7, inf, inf
    3, 4, 8, inf, inf
    5, 6, 9, inf, inf, 
    inf, inf, inf, inf, inf, 
    inf, inf, inf, inf, inf.
    

    所以中位数的中位数确实是9。

    您建议的[算法中位数*]算法的运行时间为:

    T(n) = O(n * log(n))
    

    现在让我们尝试分析一下我们有多少/大于 M 的数字。 我们有以下几组:

    • 深度1:n / 5个元素所有中位数
    • 深度2:n / 25个元素所有中位数
    • ...
    • 深度i:n /(5 ^ i)元素所有中位数

    每个组小于/大于前一个深度的2个元素,这个元素小于/大于前一个深度的2个元素,依此类推:

    总计算,我们得到 M 大于/小于(n *(2 ^ k)+ k * n)/((2 ^ k)*(5 ^ k) )。对于深度= 1,您获得中位数的中位数,即3n / 10。

    现在假设你的深度是[log_5(n)],即n = 5 ^ k,我们得到:

    5 ^ k *(k + 2 ^ k)/(5 ^ k * 2 ^ k),其是 - > 1。