我正在尝试编写一个代码,搜索numpy数组,以查找第五列中的值不包含50
的情况。如果没有,我希望将其删除。
这是我到目前为止所拥有的:
for rows in range(len(b)):
if b[:,4].any() != 50:
b = np.delete(b, b[rows])
但是,我不断收到以下错误消息:
数组索引过多
答案 0 :(得分:1)
让我们使用一些可诊断的打印结果进行计算。请注意在哪里发生错误。那很重要! (我们不应该只是在尝试问题而不隔离问题!)
In [2]: b=np.array([[0,1,2],[1,2,3],[2,1,2]])
In [3]: for row in range(len(b)):
...: print(row)
...: if b[:,2].any() !=2:
...: print(b[row])
...: b = np.delete(b, b[row])
...:
0
[0 1 2]
1
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-3-04dc188d9a2b> in <module>()
1 for row in range(len(b)):
2 print(row)
----> 3 if b[:,2].any() !=2:
4 print(b[row])
5 b = np.delete(b, b[row])
IndexError: too many indices for array
因此错误发生在第二次迭代(row
1)上。删除后的b
出了点问题。 b
的新值是什么?
In [4]: b
Out[4]: array([1, 2, 3, 2, 1, 2])
b
是一个1d数组,而不是我们开始使用的2d。这就解释了错误,对吗?使用delete
一定有问题。也许我们需要检查其文档????
查看axis
参数:
axis : int, optional
The axis along which to delete the subarray defined by `obj`.
If `axis` is None, `obj` is applied to the flattened array.
我们未指定轴,因此将删除应用于展平的数组,结果展平-1d。
但是,即使我指定了一个轴,也会出现错误(我不会进入该错误),这提示我要更仔细地研究if
条件:
In [10]: b[:,2]
Out[10]: array([2, 3, 2])
In [11]: b[:,2].any()
Out[11]: True
In [12]: b[:,2]!=2
Out[12]: array([False, True, False])
将any
应用于该列是没有意义的-它只是检查该列中是否有任何值都不为0。相反,我们要针对目标测试该列,并获得一个与该列中的列匹配的布尔值大小。
我们可以将该布尔值直接用作行选择掩码
In [13]: b[_,:]
Out[13]: array([[1, 2, 3]])
无需迭代。
迭代的另一个问题。您在范围(3)[0,1,2]上进行迭代。但是在循环内部,您尝试从b
中删除一行,从而更改b
的大小。当您尝试按数字索引b[row]
时,会出现问题,对吗?在使用Python或numpy进行迭代时,请注意修改要迭代的对象。
很抱歉对此困扰不已,但是您似乎需要一些基本的调试指南。
这是一种基本的列表方法:
In [15]: [row for row in b if row[2]!=2]
Out[15]: [array([1, 2, 3])]
我要遍历行,而不是它们的索引,并针对每一行检查列值,如果检查为True,则保留该行。我们可以使用np.delete
来做到这一点,但是列表理解更加清晰(而且速度更快)。
答案 1 :(得分:0)
最好提供b
和所需的输出,但是如果我理解正确,则可以使用:
import numpy as np
b = np.array([[50, 2, 3, 4, 5, 6],
[4, 50, 6, 7, 8, 9],
[1, 1, 1, 1, 50, 9]])
array([[50, 2, 3, 4, 5, 6],
[ 4, 50, 6, 7, 8, 9],
[ 1, 1, 1, 1, 50, 9]])
然后您可以使用第5列检查哪些行包含50
b[:, 4] == 50
array([False, False, True])
并将此布尔数组反馈给b
以选择所需的列:
b[b[:, 4] == 50]
在这种情况下,您只剩下一排
array([[ 1, 1, 1, 1, 50, 9]])