欧拉计划#11 Numpy Way

时间:2018-12-16 01:54:09

标签: python pandas numpy

网格中的最大产品

问题11

在下面的20×20网格中,沿对角线的四个数字用红色标记。

这些数字的乘积为26×63×78×14 = 1788696。

在20×20网格中相同方向(上,下,左,右或对角线)上四个相邻数字的最大乘积是什么?

x ='''
08 02 22 97 38 15 00 40 00 75 04 05 07 78 52 12 50 77 91 08
49 49 99 40 17 81 18 57 60 87 17 40 98 43 69 48 04 56 62 00
81 49 31 73 55 79 14 29 93 71 40 67 53 88 30 03 49 13 36 65
52 70 95 23 04 60 11 42 69 24 68 56 01 32 56 71 37 02 36 91
22 31 16 71 51 67 63 89 41 92 36 54 22 40 40 28 66 33 13 80
24 47 32 60 99 03 45 02 44 75 33 53 78 36 84 20 35 17 12 50
32 98 81 28 64 23 67 10 26 38 40 67 59 54 70 66 18 38 64 70
67 26 20 68 02 62 12 20 95 63 94 39 63 08 40 91 66 49 94 21
24 55 58 05 66 73 99 26 97 17 78 78 96 83 14 88 34 89 63 72
21 36 23 09 75 00 76 44 20 45 35 14 00 61 33 97 34 31 33 95
78 17 53 28 22 75 31 67 15 94 03 80 04 62 16 14 09 53 56 92
16 39 05 42 96 35 31 47 55 58 88 24 00 17 54 24 36 29 85 57
86 56 00 48 35 71 89 07 05 44 44 37 44 60 21 58 51 54 17 58
19 80 81 68 05 94 47 69 28 73 92 13 86 52 17 77 04 89 55 40
04 52 08 83 97 35 99 16 07 97 57 32 16 26 26 79 33 27 98 66
88 36 68 87 57 62 20 72 03 46 33 67 46 55 12 32 63 93 53 69
04 42 16 73 38 25 39 11 24 94 72 18 08 46 29 32 40 62 76 36
20 69 36 41 72 30 23 88 34 62 99 69 82 67 59 85 74 04 36 16
20 73 35 29 78 31 90 01 74 31 49 71 48 86 81 16 23 57 05 54
01 70 54 71 83 51 54 69 16 92 33 48 61 43 52 01 89 19 67 48
'''

import numpy as np
import pandas as pd
arr = np.array(list((x.split())), dtype = int)
arr = arr.reshape(20,20)
arr_m = np.zeros((20,20))

方法遍历元素

%%time

for i in range(0, 17):
  for j in range(0, 17):
    x = [k for k in range(i, i+4)]
    y = [k for k in range(j, j+4)]
    arr_m[i,j] = max(arr[i,j: j+4].prod(), arr[i:i+4,j].prod(), arr[x, y].prod(),) 

print(arr_m.max())

方法遍历行,列和子对象

arr1 = np.zeros((20, 20), dtype=int)
arr2 = np.zeros((20, 20), dtype=int)
arr3 = np.zeros((20, 20), dtype=int)

%%time

for i in range(0, 20):
  arr1[:, i] = arr[:, i: i+4].prod(1)

for i in range(0, 20):
  arr2[i, :] = arr[i:i+4, :].prod(0)

for i in range(0, 20):
  for j in range(0, 20):
    arr3[i,j] = arr[i: i+4, j: j+4].diagonal().prod()

max(arr1.max(), arr2.max(), arr3.max())

我想稍微推一下。

有没有纯粹的numpy或pandas方法可以做到没有循环?

3 个答案:

答案 0 :(得分:4)

这是使用stride_tricks的方法。它沿所有相关方向创建窗口视图,然后相乘并找到最佳值的索引。 剩下的只是一些记账工作,可以恢复原始网格中的索引。

import numpy as np

x = '''08 02 22 97 38 15 00 40 00 75 04 05 07 78 52 12 50 77 91 08
49 49 99 40 17 81 18 57 60 87 17 40 98 43 69 48 04 56 62 00
81 49 31 73 55 79 14 29 93 71 40 67 53 88 30 03 49 13 36 65
52 70 95 23 04 60 11 42 69 24 68 56 01 32 56 71 37 02 36 91
22 31 16 71 51 67 63 89 41 92 36 54 22 40 40 28 66 33 13 80
24 47 32 60 99 03 45 02 44 75 33 53 78 36 84 20 35 17 12 50
32 98 81 28 64 23 67 10 26 38 40 67 59 54 70 66 18 38 64 70
67 26 20 68 02 62 12 20 95 63 94 39 63 08 40 91 66 49 94 21
24 55 58 05 66 73 99 26 97 17 78 78 96 83 14 88 34 89 63 72
21 36 23 09 75 00 76 44 20 45 35 14 00 61 33 97 34 31 33 95
78 17 53 28 22 75 31 67 15 94 03 80 04 62 16 14 09 53 56 92
16 39 05 42 96 35 31 47 55 58 88 24 00 17 54 24 36 29 85 57
86 56 00 48 35 71 89 07 05 44 44 37 44 60 21 58 51 54 17 58
19 80 81 68 05 94 47 69 28 73 92 13 86 52 17 77 04 89 55 40
04 52 08 83 97 35 99 16 07 97 57 32 16 26 26 79 33 27 98 66
88 36 68 87 57 62 20 72 03 46 33 67 46 55 12 32 63 93 53 69
04 42 16 73 38 25 39 11 24 94 72 18 08 46 29 32 40 62 76 36
20 69 36 41 72 30 23 88 34 62 99 69 82 67 59 85 74 04 36 16
20 73 35 29 78 31 90 01 74 31 49 71 48 86 81 16 23 57 05 54
01 70 54 71 83 51 54 69 16 92 33 48 61 43 52 01 89 19 67 48
'''

arr = np.array(list((x.split())), dtype = int)
arr = arr.reshape(20,20)

I, J = arr.shape
S, T = arr.strides

horz = np.lib.stride_tricks.as_strided(arr, (I, J-3, 4), (S, T, T)).prod(axis=2)
vert = np.lib.stride_tricks.as_strided(arr, (I-3, J, 4), (S, T, S)).prod(axis=2)
tlbr = np.lib.stride_tricks.as_strided(arr, (I-3, J-3, 4), (S, T, S+T)).prod(axis=2)
bltr = np.lib.stride_tricks.as_strided(arr[3:], (I-3, J-3, 4), (S, T, -S+T)).prod(axis=2)

all_ = horz, vert, tlbr, bltr

midx = [np.unravel_index(o.argmax(), o.shape) for o in all_]
mval = [o[idx] for o, idx in zip(all_, midx)]

hy, hx, vy, vx, ty, tx, by, bx = np.ravel(midx)
a = np.arange(4)
idx = list(map(tuple, np.reshape(np.s_[hy, hx:hx+4, vy:vy+4, vx, ty+a, tx+a, by+a[::-1], bx+a], (4, 2))))

for name, I, V in zip('horizontal vertical topleft-bottomright bottomleft-topright'.split(), idx, mval):
    print('best', name, ':', V, '=', ' x '.join(map(str, arr[I])))

输出:

best horizontal : 48477312 = 78 x 78 x 96 x 83
best vertical : 51267216 = 66 x 91 x 88 x 97
best topleft-bottomright : 40304286 = 94 x 99 x 71 x 61
best bottomleft-topright : 70600674 = 87 x 97 x 94 x 89

答案 1 :(得分:3)

Numpy加速计算,但最重要的是,它还提供了多种方式来扫描数据。为了简化有用产品的计算,您可以:

  • 使用0填充数组以简单地管理边框。
  • 使用扁平化的数据版本:那么不同的方向只是不同的转变。这四个方向以相同的逻辑进行管理。

代码:

data = pd.read_clipboard(header=None).values # read the tray
m,n = data.shape
blocksize = 4

arr = np.zeros((m+blocksize,n+1),int) #pad with the right amount of zeros. 
arr[:m,:n] = data
flat = arr.ravel() 
usefulsize = data.size + m  # indice of last non zero value + 1

shifts = [1,n,n+1,n+2] # - / | \ , the four directions
blocks = np.array([[flat[i*s:][:usefulsize] for s in shifts] \
                                            for i in range(blocksize)]) #15µs
scores=blocks.prod(axis=0) #8µs

“开发”时间更短,比循环快200倍左右。输出:

print(scores.max())
i,j = np.where(scores==scores.max())
print(blocks[:,i,j])

70600674
[[89][94][97][87]]

答案 2 :(得分:0)

我的镜头是

def n_prod_max(df, n):    

    # No rolling(...).prod() or anything out of pandas' box
    win_prod = lambda x: x.prod()

    # Supposed to be square
    df_size = df.shape[0]
    diag_nums = pd.Series(range(-df_size + n, df_size - n + 1))

    # Columns max
    col_max = df.rolling(n).agg(win_prod).max().max()

    # Rows max
    row_max = df.T.rolling(n).agg(win_prod).max().max()

    # Diagonals max
    diag_vals = df.values
    diag_max = diag_nums.apply(lambda d: pd.Series(diag_vals.diagonal(d))
                                             .rolling(n)
                                             .agg(win_prod)
                                             .max()).max()

    # Antidiagonals max
    adiag_vals = np.rot90(df.values)
    adiag_max = diag_nums.apply(lambda d: pd.Series(adiag_vals.diagonal(d))
                                              .rolling(n)
                                              .agg(win_prod)
                                              .max()).max()

    return max([col_max, row_max, diag_max, adiag_max])

>>> n_prod_max(df, 4)
70600674.0