我有一组数据,我想要标准化。但是在集合中,有一些我不想使用的数字(异常值)。
因此,更一般地说,是否有办法进行数组计算并省略numpy中的某些数组元素?
答案 0 :(得分:1)
根据numpy数组的实现方式,您可以使用以下条件操作:
import numpy as np
# Instantiates a sample array.
x = np.array([1, 2, 3, 4, 5])
# Sets the boundary conditions of the operation.
x_min = 2
x_max = 4
# Performs an operation on elements satisfying the boundary conditions.
x[(x_min <= x) & (x <= x_max)] += 10
在这种情况下,在条件操作之前,x = [1, 2, 3, 4, 5]
。但是,在条件操作之后,x = [1, 12, 13, 14, 5]
。也就是说,它只对那些满足边界条件的元素进行操作。
你也可以使用numpy where()
函数来完成同样的事情:
x[np.where((x_min <= x) & (x <= x_max))] += 10
但是,如果您想完全省略数组中不需要的值,可以使用以下任何一种方法:
x = x[(x_min <= x) & (x <= x_max)]
x = x[np.where((x_min <= x) & (x <= x_max))]
x = np.delete(x, np.where(~(x_min <= x) | ~(x <= x_max)))
在赋值后x = [2 3 4]
,满足边界条件的那些元素。