给出一个2300行和44列的numpy数组,我希望我的脚本检查相等的行,并使用原始矩阵中的相应索引返回这些相等的行的数组。
示例:
1 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
1 0 0 0 0
1 2 3 4 5
结果:
equal_arrays1 = [1,2,3]
equal_arrays2 = [0,4]
我的原始数据集包括从1323年到1699年的零行。结果应该是:
equal_array1=[1323,...,1699]
到目前为止,我一直在使用以下代码:
import numpy as np
input_data = np.load('1IN.npy')
print(np.shape(input_data))
for i in range(len(input_data)):
for j in range(i+1,len(input_data)):
if np.array_equal(input_data[i],input_data[j]):
if np.array_equal(input_data[:,i],input_data[:,j]):
print (i, j),
else: break
但这会导致错误:
if np.array_equal(input_data[:,i],input_data[:,j]) :
IndexError: index 1302 is out of bounds for axis 1 with size 44
我认为这不是实现我想要实现的最佳方法,因此,如果有人有更好的选择或者可以解释我需要解决的问题,我将很高兴,因为我是python的新手。
答案 0 :(得分:1)
您只想检查行,因此取消对列相等性的检查:
id : station identification code
date : date in YYYY-MM-DD format (e.g. 2012-01-24 = January 24, 2012)
element : indicator of element type
TMAX : Maximum temperature (tenths of degrees C)
TMIN : Minimum temperature (tenths of degrees C)
value : data value for element (tenths of degrees C)
不确定中断时间是什么?如果找到与您的matching_pairs = []
for i in range(len(input_data)):
for j in range(i+1,len(input_data)):
if np.array_equal(input_data[i],input_data[j]):
matching_pairs.append((i, j))
# break?
print(matching_pairs)
相匹配的j
,则可能要中断,但如果找不到则不希望中断,否则,您只会将i
与{ {1}},仅此而已。