python - 前缀和算法

时间:2016-10-31 03:56:51

标签: python algorithm

我正在尝试抓住前缀总和概念背后的想法,查看由Codility here蘑菇选择器问题)的前缀总和课程中提供的示例

我的理解是整个概念基于简单的属性,其中在数组A的两个位置A(pos_left,pos_right)之间找到所有元素的总和,使用第二个数组P,其中所有元素被连续求和,其中搜索的总和计算为
value(P(pos_right + 1)) - 值(P(pos_left))。

A 1 2 3 4 5  6
P 0 1 3 6 10 15 21
sum of all elements between A[2] and A[5] = 3+ 4 + 5 = 12
or using the prefix sums"   P[5+1] - P[2] = 15 -3 = 12 
  

问题
  每个地方都有一条蘑菇街   通过非空向量。鉴于选择器的初始位置及其   移动范围,可能收集的最大蘑菇数量   寻找。

看一下这个例子,我不明白循环构造背后的逻辑。任何人都可以澄清这种算法的机制吗?

其次,我发现这个例子中的positoin索引非常混乱和麻烦。通常的做法是将前缀加上的矢量“移位”在开始时为零吗? (事实上​​,向量中的计数元素从python中的0开始,因为已经引起了一些混乱)。

解决方案

def prefix_sums(A):
  n = len(A)
  P = [0] * (n + 1)
  for k in xrange(1, n + 1):
      P[k] = P[k - 1] + A[k - 1]
  return P


def count_total(P, x, y):
    return P[y + 1] - P[x]

# A mushroom picker is at spot number k on the road and should perform m moves
def mushrooms(A, k, m):
    n = len(A)
    result = 0
    pref = prefix_sums(A)
    for p in xrange(min(m, k) + 1):   # going left
        left_pos = k - p
        right_pos = min(n - 1, max(k, k + m - 2 * p))
        result = max(result, count_total(pref, left_pos, right_pos))
    for p in xrange(min(m + 1, n - k)):
        right_pos = k + p
        left_pos = max(0, min(k, k - (m - 2 * p)))
        result = max(result, count_total(pref, left_pos, right_pos))
    return result   

我已经为一个小数组A= [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]运行了一些例子,选择了位置k = 5和范围m = 3.我不明白创建范围以通过两个循环检查的逻辑。 / p>

我得到了循环的以下参数

(p=, left_pos=, right_pos=)   
loop 1  (0,5,8), (1,4,6),(2,3,5),(3,2,5)
loop 2  (0,2,5), (1,4,6), (2,5,7), (3,5,8)

rangies各不相同。为什么呢?

用于调试的版本

def mushrooms2(A, k, m):
    n = len(A)
    result = 0
    pref = prefix_sums(A)
    l1 =min(m, k) + 1
    print 'loop p in xrange(min(m, k) + 1): %d' % l1
    for p in xrange(min(m, k) + 1):
        print 'p %d' % p
        print 'A= %r' % A
        print 'pref= %r' % pref
        left_pos = k - p
        right_pos = min(n - 1, max(k, k + m - 2 * p))
        result = max(result, count_total(pref, left_pos, right_pos))
        print 'left_pos = k - p= %d' % left_pos
        print 'right_pos= min(n-1,max(k,k+m-2*p))= %d' % right_pos
        print 'max'
        print '(result %d' % result
        print 'count_total(pref, left_pos, right_pos)) %r, %r, %r, %r' % (pref,left_pos, right_pos,count_total(pref, left_pos, right_pos))
        print 'result= %d' % result
        print 'next p'
    l2=min(m + 1, n - k)
    print   'loop xrange(min(m + 1, n - k)): %d' % l2
    for p in xrange(min(m + 1, n - k)):
        print 'p %d' % p
        print 'A= %r' % A
        print 'pref= %r' % pref
        right_pos = k + p
        left_pos = max(0, min(k, k - (m - 2 * p)))
        result = max(result, count_total(pref, left_pos, right_pos))
        print 'right_pos = k + p= %d' % right_pos
        print 'left_pos = max(0, min(k, k - (m - 2 * p)))= %d' % left_pos
        print 'max'
        print '(result %d' % result
        print 'count_total(pref, left_pos, right_pos)) %r, %r, %r, %r' % (pref,left_pos, right_pos,count_total(pref, left_pos, right_pos))
        print 'result= %d' % result
        print 'next p'
    print 'result %d' % result
    return result

2 个答案:

答案 0 :(得分:8)

你并不是唯一一个认为循环结构是反直觉的,因为我不得不花几分钟时间。这是我想出来的。

现在,您提供的链接中的解决方案进一步详细说明了最佳策略是在路径上行走,以便只改变方向一次。以这种方式,人们可以覆盖具有左右端点的范围,left_posright_pos似乎代表了这一范围。

关于循环的细节,而不是根据循环变量(即p)来考虑循环,更容易找出循环过程中的变化,以及如何{{ 1}}被使用。否则,弄清楚那些最小和最大表达式中的内容在开始时似乎有点过于奇特。

例如,在第一个循环中,尝试pleft_pos得到的不同值的影响,而不是弄清楚该范围代表什么。经过一番思考后,人们注意到p以符合可能的左端点的方式发生了变化。

具体来说,当left_pos时,左端点是起始索引(即p == 0),当kp时,则它是0(即如果{{ 1}})或min(m, k)。在前一种情况下,就左边的终点而言,它就会离开道路上有效的点范围。在后一种情况下,移动次数禁止k < m小于(k - m)的任何解决方案,因为在m次移动中无法从left_pos转到那些索引。

可以类似地解释在第一个循环中对(k - m)的分配。 min语句包括k,这是可以到达的最右边的合法索引,它用于将正确的端点保持在允许的限制内。内部max语句具有right_pos,因为它是(n-1)的最小可能值。 (即由于k是起点)它也有一个表达式right_pos。此表达式表示以下过程:

  • 左转进行移动。
  • 改变方向,然后向右移动p移动到达起点。
  • 使用剩余的k移动向右移动。

第二个循环只是第一个循环的反映,你可以通过调整我对第一个循环的解释来解释它。

至于你的第二个问题,我认为通常的做法是转移前缀和数组的索引。我通常在在线竞赛中使用这种方法进行竞争性编程,我在Python中使用的前缀和数组的实现如下所示。

(k + m - 2 * p)

我对上述实施的直觉是:在(m - 2p),我们有包含总和def prefix_sums(A): n = len(A) P = [0] * n P[0] = A[0] for k in xrange(1, n): P[k] = P[k - 1] + A[k] return P def count_total(P, x, y): return (P[y] - P[x - 1] if x > 0 else P[y])

答案 1 :(得分:1)

在阅读了主题之后,仍然很难理解这个主意,直到我实现了幼稚的解决方案(这是codility document中的第一篇)

难以理解的解决方案#2只是模仿了左右移动,而所有这些看起来很奇怪的计算仅是为了获得区域的左右边界(就像您真正在其中移动一样)。因此,每次迭代意味着使用6个步骤的一个完整周期。

如果您先左移然后右移 (p = 0 ... M),您有

  • 向左走0步,向右走6步(实际上0和2步会导致阵列失灵 边界),因此区域的左边界在索引4处,右边界在索引处 索引6
  • 向左走1步,向右走5步(分别为1和3),因此边框为左 在索引3处,右边界在索引6处
  • 左2步,右4步(分别为2和4)...继续计算

这是我的PHP版本,代码过分简化,并提供了更多变量,以方便理解

function prefix_sums(array $a)
{
    $n = count($a);
    $p = array_fill(0, $n + 1, 0);
    for ($i = 1; $i <= $n; $i++) {
        $p[$i] = $p[$i - 1] + $a[$i - 1];
    }
    return $p;
}

function count_total($p, $x, $y)
{
    return $p[$y + 1] - $p[$x];
}

function mushrooms(array $a, int $k, int $m)
{
    $n = count($a) - 1;
    $max = 0;
    $sums = prefix_sums($a);
    //start  moving to the left and then the right
    for ($p = 0; $p < $m; $p++) {
        $stepsLeft = $p;
        $realStepsLeft = min($k, $stepsLeft);
        $leftBorder = $k - $realStepsLeft;

        $stepsRight = $m - $stepsLeft;
        $realStepsRight = min($n - $leftBorder, $stepsRight);
        $rightBorder = $leftBorder + $realStepsRight;

        $max = max($max, count_total($sums, $leftBorder, $rightBorder));
    }
    //moving to the right and then the left
    for ($p = 0; $p < $m; $p++) {
        $stepsRight = $p;
        $realStepsRight = min($p, $n - $k);
        $rightBorder = $k + $realStepsRight;

        $stepsLeft = $m - $stepsRight;
        $realStepsLeft = min(($k + $realStepsRight), $stepsLeft);
        $leftBorder = $rightBorder - $realStepsLeft;

        $max = max($max, count_total($sums, $leftBorder, $rightBorder));
    }
    return $max;
}

assert(ASSERT_EXCEPTION, 1);
assert(mushrooms([2, 3, 7, 5, 1, 3, 9], 4, 6) == 25);

echo 'Success';