我有一个1700值的数组(msaarr),范围从大约0到150.我知道这些值中的894应该小于2,我希望创建一个只包含这些值的新数组。
到目前为止,我尝试过这段代码:
Combined = np.zeros(shape=(894,8))
for i in range(len(Spitzer)): #len(Spitzer) = 1700
index = np.where(msaarr <= 2)
Combined[:,0] = msaarr[index]
有八列的原因是因为我有更多的数据与msaarr中的每个值相关联,我也想显示。 msaarr是使用几行代码创建的,这就是为什么我在这里没有提到它们,但它是一个形状为(1700,1)且类型为float64的数组。
我遇到的问题是,如果我打印msaarr [index],那么我得到一个形状数组(893,),但当我尝试将其指定为我的第0列时,我收到错误< / p>
ValueError: could not broadcast input array from shape (1699) into shape (894)
我也尝试了
Combined[:,0] = np.extract(msaarr <= 2, msaarr)
出了同样的错误。
我一开始认为这可能与Python的零索引有些混淆,所以我尝试将形状更改为893,并尝试将其分配给另一列[:,1],但我每次都有相同的错误。
或者,当我尝试:
Combined[:,1][i] = msaarr[index][i]
我收到错误:
IndexError: index 894 is out of bounds for axis 0 with size 894
我做错了什么?
编辑:
一位朋友指出我可能没有正确地调用索引,因为它是一个元组,所以他的建议是:
index = np.where(msaarr < 2)
Combined[:,0] = msaarr[index[0][:]]
但我仍然收到此错误:
ValueError: could not broadcast input array from shape (893,1) into shape (893)
我的形状怎么样(893)而不是(893,1)?
另外,我做了检查,len(index [0] [:])= 893,而len(msaarr [index [0] [:]])= 893。
上次尝试的完整代码是:
import numpy as np
from astropy.io import ascii
from astropy.io import fits
targets = fits.getdata('/Users/vcolt/Dropbox/ATLAS source matches/OzDES.fits')
Spitzer = ascii.read(r'/Users/vcolt/Desktop/Catalogue/cdfs_spitzer.csv', header_start=0, data_start=1)
## Find minimum separations, indexed.
RADiffArr = np.zeros(shape=(len(Spitzer),1))
DecDiffArr = np.zeros(shape=(len(Spitzer),1))
msaarr = np.zeros(shape=(len(Spitzer),1))
Combined= np.zeros(shape=(893,8))
for i in range(len(Spitzer)):
x = Spitzer["RA_IR"][i]
y = Spitzer["DEC_IR"][i]
sep = abs(np.sqrt(((x - targets["RA"])*np.cos(np.array(y)))**2 + (y - targets["DEC"])**2))
minsep = np.nanmin(sep)
minseparc = minsep*3600
msaarr[i] = minseparc
min_positions = [j for j, p in enumerate(sep) if p == minsep]
x2 = targets["RA"][min_positions][0]
RADiff = x*3600 - x2*3600
RADiffArr[i] = RADiff
y2 = targets["DEC"][min_positions][0]
DecDiff = y*3600 - y2*3600
DecDiffArr[i] = DecDiff
index = np.where(msaarr < 2)
print msaarr[index].shape
Combined[:,0] = msaarr[index[0][:]]
无论index = np.where(msaarr&lt; 2)是否进入循环,我都会得到同样的错误。
答案 0 :(得分:2)
看一下将numpy.take
与numpy.where
结合使用。
inds = np.where(msaarr <= 2)
new_msaarr = np.take(msaarr, inds)
如果它是一个多维数组,您还可以添加axis
关键字以沿该轴获取切片。
答案 1 :(得分:0)
我认为循环不在正确的位置。 np.where()
将返回与您指定的条件匹配的元素索引数组。
这应该足够了
Index = np.where(msaarr <= 2)
因为index是一个数组。您需要遍历此索引并填充组合[:0]
中的值我还要指出一件事。您已经说过,将会有894个小于2的值,但在使用的代码中,您使用的值小于等于2.
答案 2 :(得分:0)
np.where(condition)
将返回一个数组元组,其中包含用于验证您的条件的元素的索引。
要获取验证条件的元素数组,请使用:
new_array = msaarr[msaarr <= 2]
>>> x = np.random.randint(0, 10, (4, 4))
>>> x
array([[1, 6, 8, 4],
[0, 6, 6, 5],
[9, 6, 4, 4],
[9, 6, 8, 6]])
>>> x[x>2]
array([6, 8, 4, 6, 6, 5, 9, 6, 4, 4, 9, 6, 8, 6])