错误:在numpy数组中搜索相同的行时越界

时间:2018-12-12 11:34:16

标签: python numpy rows equals

给出一个2300行和44列的numpy数组,我希望我的脚本检查相等的行,并使用原始矩阵中的相应索引返回这些相等的行的数组。

示例:

1 0 0 0 0
0 0 0 0 0 
0 0 0 0 0 
0 0 0 0 0 
1 0 0 0 0
1 2 3 4 5

结果:

equal_arrays1 = [1,2,3]
equal_arrays2 = [0,4]

我的原始数据集包括从1323年到1699年的零行。结果应该是:

equal_array1=[1323,...,1699]

到目前为止,我一直在使用以下代码:

import numpy as np


input_data = np.load('1IN.npy')
print(np.shape(input_data))

for i in range(len(input_data)):
   for j in range(i+1,len(input_data)):
      if np.array_equal(input_data[i],input_data[j]):
          if np.array_equal(input_data[:,i],input_data[:,j]):
           print (i, j),
      else: break

但这会导致错误:

if np.array_equal(input_data[:,i],input_data[:,j])   :

IndexError: index 1302 is out of bounds for axis 1 with size 44

我认为这不是实现我想要实现的最佳方法,因此,如果有人有更好的选择或者可以解释我需要解决的问题,我将很高兴,因为我是python的新手。

1 个答案:

答案 0 :(得分:1)

您只想检查行,因此取消对列相等性的检查:

id : station identification code
date : date in YYYY-MM-DD format (e.g. 2012-01-24 = January 24, 2012)
element : indicator of element type
TMAX : Maximum temperature (tenths of degrees C)
TMIN : Minimum temperature (tenths of degrees C)
value : data value for element (tenths of degrees C)

不确定中断时间是什么?如果找到与您的matching_pairs = [] for i in range(len(input_data)): for j in range(i+1,len(input_data)): if np.array_equal(input_data[i],input_data[j]): matching_pairs.append((i, j)) # break? print(matching_pairs) 相匹配的j,则可能要中断,但如果找不到则不希望中断,否则,您只会将i与{ {1}},仅此而已。