Numpy裁剪2D阵列到非NaN值

时间:2014-09-14 07:24:10

标签: python numpy

我有一个2D Numpy数组,其中包含一个被NaN海洋包围的数据岛。

我想裁剪数组,使其仅包含边界框和非NaN区域的内容。

我还想知道这个盒子相对于原始数组的索引和大小。

这可能吗?

1 个答案:

答案 0 :(得分:7)

import numpy as np
a = np.empty((15,10))
a.fill(np.nan)
a[7,6] = 76
a[8,5] = 85
a[9,5] = 95
a[9,7] = 97

现在我们有一个包含15行和10列的数组,其中包含NAN海中的数据孤岛:

nan,  76.,  nan,
85.,  nan,  nan,
95.,  nan,  97.,

下一步:

nans = np.isnan(a)
nancols = np.all(nans, axis=0) # 10 booleans, True where col is all NAN
nanrows = np.all(nans, axis=1) # 15 booleans

firstcol = nancols.argmin() # 5, the first index where not NAN
firstrow = nanrows.argmin() # 7

lastcol = len(nancols) - nancols[::-1].argmin() # 8, last index where not NAN
lastrow = len(nanrows) - nanrows[::-1].argmin() # 10

最后:

a[firstrow:lastrow,firstcol:lastcol]

告诉我们岛屿:

array([[ nan,  76.,  nan],
       [ 85.,  nan,  nan],
       [ 95.,  nan,  97.]])