我有一个2D Numpy数组,其中包含一个被NaN海洋包围的数据岛。
我想裁剪数组,使其仅包含边界框和非NaN区域的内容。
我还想知道这个盒子相对于原始数组的索引和大小。
这可能吗?
答案 0 :(得分:7)
import numpy as np
a = np.empty((15,10))
a.fill(np.nan)
a[7,6] = 76
a[8,5] = 85
a[9,5] = 95
a[9,7] = 97
现在我们有一个包含15行和10列的数组,其中包含NAN海中的数据孤岛:
nan, 76., nan,
85., nan, nan,
95., nan, 97.,
下一步:
nans = np.isnan(a)
nancols = np.all(nans, axis=0) # 10 booleans, True where col is all NAN
nanrows = np.all(nans, axis=1) # 15 booleans
firstcol = nancols.argmin() # 5, the first index where not NAN
firstrow = nanrows.argmin() # 7
lastcol = len(nancols) - nancols[::-1].argmin() # 8, last index where not NAN
lastrow = len(nanrows) - nanrows[::-1].argmin() # 10
最后:
a[firstrow:lastrow,firstcol:lastcol]
告诉我们岛屿:
array([[ nan, 76., nan],
[ 85., nan, nan],
[ 95., nan, 97.]])