如何将NumPy数组规范化到一定范围内?

时间:2009-11-14 17:52:39

标签: python arrays numpy scipy convenience-methods

在对音频或图像阵列进行一些处理之后,需要在一个范围内对其进行标准化,然后才能将其写回文件。这可以这样做:

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

是否有一个不那么详细,方便的功能方法来做到这一点? matplotlib.colors.Normalize()似乎没有关联。

8 个答案:

答案 0 :(得分:114)

audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())

使用/=*=可以消除中间临时数组,从而节省一些内存。乘法比除法便宜,所以

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

略快于

image /= image.max()/255.0    # Uses 1+image.size divisions

由于我们在这里使用的是基本的numpy方法,我认为这是一个非常有效的numpy解决方案。

答案 1 :(得分:38)

如果数组同时包含正面和负面数据,我会选择:

import numpy as np

a = np.random.rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer
c = 255*(a - np.min(a))/np.ptp(a).astype(int)

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

另外,值得一提的是,即使它不是OP的问题,standardization

e = (a - np.mean(a)) / np.std(a)

答案 2 :(得分:35)

您还可以使用sklearn重新缩放。优点是您可以调整标准偏差的标准化,除了以数据为中心,还可以在任意轴,特征或记录上执行此操作。

from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )

关键字参数axiswith_meanwith_std是自解释的,并以默认状态显示。参数copy如果设置为False,则就地执行操作。文档here

答案 3 :(得分:11)

您可以使用“i”(如idiv,imul ..)版本,它看起来并不坏:

image /= (image.max()/255.0)

对于另一种情况,您可以编写一个函数来按字母顺序标准化n维数组:

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()

答案 4 :(得分:3)

一个简单的解决方案是使用sklearn.preprocessing库提供的缩放器。

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

错误X_rec-X将为零。您可以根据需要调整feature_range,甚至可以使用标准缩放器sk.StandardScaler()

答案 5 :(得分:3)

您正在尝试将audio的值在-1和+1之间最小化,将image的值在0和255之间最小化。

使用sklearn.preprocessing.minmax_scale应该可以轻松解决您的问题。

例如:

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

注释:不要与将向量的norm(长度)缩放到某个值(通常为1)(通常也称为归一化)的操作相混淆

答案 6 :(得分:2)

我尝试关注this,并收到错误

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

我尝试规范化的numpy数组是一个integer数组。似乎他们在版本>中弃用了类型转换。 1.10,您必须使用numpy.true_divide()来解决此问题。

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

img是一个PIL.Image对象。

答案 7 :(得分:0)

This answersimilar question 为我解决了问题

np.interp(a, (a.min(), a.max()), (-1, +1))