Numpy在哪里功能多种条件

时间:2013-05-02 17:03:19

标签: python numpy

我有一系列称为dists的距离。我想选择两个值之间的dists。我写了以下代码来做到这一点:

 dists[(np.where(dists >= r)) and (np.where(dists <= r + dr))]

然而,这只选择条件

 (np.where(dists <= r + dr))

如果我通过使用临时变量顺序执行命令,它可以正常工作。为什么上面的代码不起作用,我如何让它工作?

干杯

8 个答案:

答案 0 :(得分:154)

您的特定情况的最佳方式只是将您的两个条件更改为一个标准:

dists[abs(dists - r - dr/2.) <= dr/2.]

它只创建一个布尔数组,在我看来更容易阅读,因为它说{em>在distdr中是r?(虽然我将r重新定义为您感兴趣的区域的中心而不是开头,所以r = r + dr/2.)但是这不能回答您的问题。


您的问题的答案:
如果您只是想过滤掉不符合条件的where元素,则实际上并不需要dists

dists[(dists >= r) & (dists <= r+dr)]

因为&会为您提供元素and(括号是必要的)。

或者,如果您出于某种原因想要使用where,则可以执行以下操作:

 dists[(np.where((dists >= r) & (dists <= r + dr)))]

<强>为什么:
它不起作用的原因是因为np.where返回索引列表,而不是布尔数组。您试图在两个数字列表之间获取and,这当然没有您期望的True / False值。如果ab都是True值,则a and b会返回b。所以说[0,1,2] and [2,3,4]之类的内容只会给你[2,3,4]。这是在行动:

In [230]: dists = np.arange(0,10,.5)
In [231]: r = 5
In [232]: dr = 1

In [233]: np.where(dists >= r)
Out[233]: (array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19]),)

In [234]: np.where(dists <= r+dr)
Out[234]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)

In [235]: np.where(dists >= r) and np.where(dists <= r+dr)
Out[235]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)

您期望比较的只是布尔数组,例如

In [236]: dists >= r
Out[236]: 
array([False, False, False, False, False, False, False, False, False,
       False,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True], dtype=bool)

In [237]: dists <= r + dr
Out[237]: 
array([ True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True, False, False, False, False, False,
       False, False], dtype=bool)

In [238]: (dists >= r) & (dists <= r + dr)
Out[238]: 
array([False, False, False, False, False, False, False, False, False,
       False,  True,  True,  True, False, False, False, False, False,
       False, False], dtype=bool)

现在你可以在组合布尔数组上调用np.where

In [239]: np.where((dists >= r) & (dists <= r + dr))
Out[239]: (array([10, 11, 12]),)

In [240]: dists[np.where((dists >= r) & (dists <= r + dr))]
Out[240]: array([ 5. ,  5.5,  6. ])

或者使用fancy indexing

简单地使用布尔数组索引原始数组
In [241]: dists[(dists >= r) & (dists <= r + dr)]
Out[241]: array([ 5. ,  5.5,  6. ])

答案 1 :(得分:41)

由于接受的答案很好地解释了问题。您也可以使用numpy logical functions更适合多种情况:

np.where(np.logical_and(np.greater_equal(dists,r),np.greater_equal(dists,r + dr)))

答案 2 :(得分:2)

尝试:

np.intersect1d(np.where(dists >= r)[0],np.where(dists <= r + dr)[0])

答案 3 :(得分:2)

我喜欢使用np.vectorize来执行此类任务。请考虑以下事项:

>>> # function which returns True when constraints are satisfied.
>>> func = lambda d: d >= r and d<= (r+dr) 
>>>
>>> # Apply constraints element-wise to the dists array.
>>> result = np.vectorize(func)(dists) 
>>>
>>> result = np.where(result) # Get output.

您也可以使用np.argwhere代替np.where来获得清晰的输出。但这是你的电话:)

希望它有所帮助。

答案 4 :(得分:1)

一件有趣的事情要指向这里;在这种情况下,也可以使用通常使用 OR AND 的常规方法,但有一点点变化。代替“ and”和“ or”,而使用 Ampersand(&) Pipe Operator(|),它将起作用。

当我们使用时:

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) and (ar<6), 'yo', ar)

Output:
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

当我们使用 Ampersand(&)

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) & (ar<6), 'yo', ar)

Output:
array(['3', 'yo', 'yo', '14', '2', 'yo', '3', '7'], dtype='<U11')

这与我们尝试对熊猫Dataframe应用多个过滤器的情况相同。现在,其背后的原因必须与逻辑运算符和按位运算符有关,并且为了对它们有更多的了解,我建议在stackoverflow中经历此answer或类似的Q / A。

答案 5 :(得分:0)

我已经找到了这个简单的例子

import numpy as np

ar = np.array([3,4,5,14,2,4,3,7])

print [X for X in list(ar) if (X >= 3 and X <= 6)]

>>> 
[3, 4, 5, 4, 3]

答案 6 :(得分:0)

这应该有效:

dists[((dists >= r) & (dists <= r+dr))]

最优雅的方式~~

答案 7 :(得分:0)

尝试:

import numpy as np
dist = np.array([1,2,3,4,5])
r = 2
dr = 3
np.where(np.logical_and(dist> r, dist<=r+dr))

输出:(array([2,3]),)

您可以查看Logic functions以获得更多详细信息。