在python中规范化numpy数组列

时间:2015-04-15 21:51:14

标签: python numpy normalize

我有一个numpy数组,其中特定行的每个单元格代表一个要素的值。我将它们全部存储在100 * 4矩阵中。

A     B   C
1000  10  0.5
765   5   0.35
800   7   0.09  

我知道如何规范化这个numpy.array的行,其中每个值介于0和1之间?

我想要的输出是:

A     B    C
1     1    1
0.765 0.5  0.7
0.8   0.7  0.18(which is 0.09/0.5)

提前致谢:)

2 个答案:

答案 0 :(得分:86)

如果我理解正确,您要做的是除以每列中的最大值。您可以使用broadcasting轻松完成此操作。

从示例数组开始:

import numpy as np

x = np.array([[1000,  10,   0.5],
              [ 765,   5,  0.35],
              [ 800,   7,  0.09]])

x_normed = x / x.max(axis=0)

print(x_normed)
# [[ 1.     1.     1.   ]
#  [ 0.765  0.5    0.7  ]
#  [ 0.8    0.7    0.18 ]]

x.max(0)在第0维度(即行)上取最大值。这会为您提供一个大小为(ncols,)的向量,其中包含每列中的最大值。然后,您可以将x除以此向量,以便对您的值进行标准化,以便将每列中的最大值缩放为1.


如果x包含负值,则需要先减去最小值:

x_normed = (x - x.min(0)) / x.ptp(0)

此处,x.ptp(0)返回"峰峰值" (即,范围,最大 - 最小)沿轴0。此标准化还保证每列中的最小值为0.

答案 1 :(得分:15)

您可以使用sklearn.preprocessing:

from sklearn.preprocessing import normalize
data = np.array([
    [1000, 10, 0.5],
    [765, 5, 0.35],
    [800, 7, 0.09], ])
data = normalize(data, axis=0, norm='max')
print(data)
>>[[ 1.     1.     1.   ]
[ 0.765  0.5    0.7  ]
[ 0.8    0.7    0.18 ]]