根据特定列中的值删除行

时间:2018-10-16 17:50:54

标签: python python-3.x numpy

我正在尝试编写一个代码,搜索numpy数组,以查找第五列中的值不包含50的情况。如果没有,我希望将其删除。

这是我到目前为止所拥有的:

for rows in range(len(b)):
    if b[:,4].any() != 50:
        b = np.delete(b, b[rows])

但是,我不断收到以下错误消息:

  

数组索引过多

2 个答案:

答案 0 :(得分:1)

让我们使用一些可诊断的打印结果进行计算。请注意在哪里发生错误。那很重要! (我们不应该只是在尝试问题而不隔离问题!)

In [2]: b=np.array([[0,1,2],[1,2,3],[2,1,2]])
In [3]: for row in range(len(b)):
   ...:     print(row)
   ...:     if b[:,2].any() !=2:
   ...:         print(b[row])
   ...:         b = np.delete(b, b[row])
   ...:         
0
[0 1 2]
1
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-3-04dc188d9a2b> in <module>()
      1 for row in range(len(b)):
      2     print(row)
----> 3     if b[:,2].any() !=2:
      4         print(b[row])
      5         b = np.delete(b, b[row])
IndexError: too many indices for array

因此错误发生在第二次迭代(row 1)上。删除后的b出了点问题。 b的新值是什么?

In [4]: b
Out[4]: array([1, 2, 3, 2, 1, 2])

b是一个1d数组,而不是我们开始使用的2d。这就解释了错误,对吗?使用delete一定有问题。也许我们需要检查其文档????

查看axis参数:

axis : int, optional
  The axis along which to delete the subarray defined by `obj`.
  If `axis` is None, `obj` is applied to the flattened array.

我们未指定轴,因此将删除应用于展平的数组,结果展平-1d。

但是,即使我指定了一个轴,也会出现错误(我不会进入该错误),这提示我要更仔细地研究if条件:

In [10]: b[:,2]
Out[10]: array([2, 3, 2])
In [11]: b[:,2].any()
Out[11]: True
In [12]: b[:,2]!=2
Out[12]: array([False,  True, False])

any应用于该列是没有意义的-它只是检查该列中是否有任何值都不为0。相反,我们要针对目标测试该列,并获得一个与该列中的列匹配的布尔值大小。

我们可以将该布尔值直接用作行选择掩码

In [13]: b[_,:]
Out[13]: array([[1, 2, 3]])

无需迭代。

迭代的另一个问题。您在范围(3)[0,1,2]上进行迭代。但是在循环内部,您尝试从b中删除一行,从而更改b的大小。当您尝试按数字索引b[row]时,会出现问题,对吗?在使用Python或numpy进行迭代时,请注意修改要迭代的对象。

很抱歉对此困扰不已,但是您似乎需要一些基本的调试指南。


这是一种基本的列表方法:

In [15]: [row for row in b if row[2]!=2]
Out[15]: [array([1, 2, 3])]

我要遍历行,而不是它们的索引,并针对每一行检查列值,如果检查为True,则保留该行。我们可以使用np.delete来做到这一点,但是列表理解更加清晰(而且速度更快)。

答案 1 :(得分:0)

最好提供b和所需的输出,但是如果我理解正确,则可以使用:

import numpy as np

b = np.array([[50, 2, 3, 4, 5, 6],
              [4, 50, 6, 7, 8, 9],
              [1, 1, 1, 1, 50, 9]])


array([[50,  2,  3,  4,  5,  6],
       [ 4, 50,  6,  7,  8,  9],
       [ 1,  1,  1,  1, 50,  9]])

然后您可以使用第5列检查哪些行包含50

b[:, 4] == 50
array([False, False,  True])

并将此布尔数组反馈给b以选择所需的列:

b[b[:, 4] == 50]

在这种情况下,您只剩下一排

array([[ 1,  1,  1,  1, 50,  9]])