找到一个增加的序列a [],它最小化sigma(abs(a [i] + c [i]))

时间:2012-05-05 10:13:43

标签: c++ algorithm optimization greedy

问题陈述

c是一个给定的n整数数组;问题是找到越来越多的n整数a (a[i] <= a[i+1]),以便最小化此总和:

abs(a[0]+c[0]) + abs(a[1]+c[1]) + ... + abs(a[n-1]+c[n-1])
// abs(x) = absolute value of x  

最优a只存在c中出现的整数,因此我们可以使用O(n^2)中的DP来解决它:

dp[i][j]: a[i] >= j'th integer  

但是应该有一个更快的解决方案,可能是O(n lg n)

1 个答案:

答案 0 :(得分:7)

更新:我添加了解决方案,最大限度地减少了绝对值之和。其他最小化平方和的解决方案仍然在这篇文章的最后,以防有人感兴趣。

最小化绝对值和算法

我从算法开始,该算法仅适用于非负整数数组。然后它将扩展为任何整数(甚至是非整数对象)。

这是一种贪婪的算法。它使用整数的按位表示。从每个数组元素的最高位开始(暂时忽略其他位)。找到最大的前缀,最大化零/零平衡。现在清除所有数组值,属于前缀并且具有零最高有效位(这些值的所有位都为零)。对于后缀中具有非零最高有效位的所有数组值,将所有其他位设置为“1”。将此算法递归地应用于前缀和后缀,使用下一位作为“最重要”。

这会将原始数组拆分为多个段。您可以找到每个段的中位数,并使用此中位数填充输出数组。或者,只需在处理前缀时在输出数组中设置相应的位,并在处理后缀时将它们保留为零。

这一切都有效,因为最小化绝对值之和需要找到子阵列的中位数,并且在找到这个中值时,你可以非常近似地比较值,总是只使用整个数组的一个最高有效位和对于子阵列,稍后会降级到其他位。

这是C ++ 11代码片段,它解释了详细信息:

//g++ -std=c++0x
#include <iostream>
#include <vector>
#include <iomanip>

using namespace std;
typedef vector<unsigned> arr_t;
typedef arr_t::iterator arr_it;

void nonincreasing(arr_it array, arr_it arrayEnd, arr_it out, int bits)
{
  if (bits != -1)
  {
    int balance = 0;
    int largestBalance = -1;
    arr_it prefixEnd = array;

    for (arr_it i = array; i != arrayEnd; ++i)
    {
      int d = ((*i >> bits) & 1)? 1: -1;
      balance += d;
      if (balance > largestBalance)
      {
        balance = largestBalance;
        prefixEnd = i + 1;
      }
    }

    for (arr_it i = array; i != prefixEnd; ++i)
    {
      *(out + (i - array)) += (1 << bits);
      if (!((*i >> bits) & 1))
      {
        *i = 0;
      }
    }
    nonincreasing(array, prefixEnd, out, bits - 1);

    for (arr_it i = prefixEnd; i != arrayEnd; ++i)
    {
      if ((*i >> bits) & 1)
      {
        *i = (1 << bits) - 1;
      }
    }
    nonincreasing(prefixEnd, arrayEnd, out + (prefixEnd - array), bits - 1);
  }
}

void printArray(const arr_t& array)
{
  for (auto val: array)
    cout << setw(2) << val << ' ';
  cout << endl;
}

int main()
{
  arr_t array({12,10,10,17,6,3,9});
  arr_t out(array.size());
  printArray(array);

  nonincreasing(begin(array), end(array), begin(out), 5);
  printArray(out);

  return 0;
}

要处理任何整数,而不仅仅是积极的,有两种选择:

  1. 在输入数组中查找最小整数,并从其他元素中减去它。完成主算法后,将其添加回来(并取消结果)。这给出了复杂度O(N log U),其中U是数组值的范围。
  2. 输入数组的紧凑值。按值排序,删除重复项,而不是原始值,使用此数组的索引。完成主算法后,将索引更改回相应的值(并取消结果)。这给出了复杂度O(N log H),其中H是唯一输入数组值的数量。此外,这不仅允许使用整数,而且可以使用任何可以订购的对象(相互比较)。

  3. 最小化平方和算法

    以下是此算法的高级描述。复杂性是O(N)。

    从搜索一个子阵列开始,从c []的开头开始,并且具有最大可能的平均值。然后在[]中用这个平均值填充相同长度的子阵列(舍入到最接近的整数并取反)。然后从[]和c []中移除此子数组(换句话说,假设[]的开头和c []按子阵列的长度向前移动)并递归地将此算法应用于[]和c的其余部分[]。

    该算法最有趣的部分是搜索最大的子阵列。使用来自c []的累积元素总数填充临时数组b []:b[0] = c[0], b[1] = b[0] + c[1], ...现在,您可以使用(b[i+m] - b[i]) / m确定c []中任何时间间隔的平均值。巧合的是,完全相同的公式(其值的最大化)确定了从b [i]到曲线的切线,由b []描述。因此,您可以使用任何Convex hull algorithm一次性找到此算法所需的所有最大值(以及子阵列边界)。凸壳算法通常使用二维点并具有超线性复杂度。但在这种情况下,点已经在一个维度中排序,因此Graham scanMonotone Chain算法在O(N)时间内完成任务,这也决定了整个算法的复杂性。


    此算法的伪代码:

    1. b [] =整合(c [])
    2. h [] = ConvexHull(b [])
    3. a [] = - 衍生物(h [])
    4. 示例数组处理的可视化:

      example