我有一个 5x600x16 数组,下面显示了一个较小的类似数组的示例。我需要在每个切片中按列对值进行归一化(总共5个)。
tensor([[[9.9771e-01, 6.6219e-02, 8.6409e-03, 1.1918e-05, 2.3837e-05],
[9.9771e-01, 6.6219e-02, 8.6409e-03, 1.1918e-05, 2.3837e-05]],
[[9.9525e-01, 9.6969e-02, 7.5091e-03, 1.0301e-05, 3.0902e-05],
[9.9802e-01, 6.2234e-02, 7.8646e-04, 2.0696e-05, 1.0348e-05]],
[[9.7093e-01, 2.3617e-01, 3.2587e-02, 0.0000e+00, 0.0000e+00],
[9.7418e-01, 2.2391e-01, 5.7788e-03, 6.0829e-05, 9.1244e-05]],
[[9.9781e-01, 6.4524e-02, 1.8817e-03, 1.8268e-05, 0.0000e+00],
[9.9153e-01, 1.2825e-01, 1.0527e-02, 0.0000e+00, 3.8630e-05]]])
出于这个问题的目的,让我们考虑一下数组
a = np.array([[[10, 100, 1], [5, 50, .5]], [[10, 1000, 10], [10, 1, 20]]])
我尝试使用normalize
中的PyTorch
,但没有成功
>>>f.normalize(torch.from_numpy(a), p=2, dim=2)
tensor([[[0.0995, 0.9950, 0.0099],
[0.0995, 0.9950, 0.0099]],
[[0.0100, 0.9999, 0.0100],
[0.4468, 0.0447, 0.8935]]], dtype=torch.float64)
和我创建的一个简单函数,取得了一些成功
def normalize(data):
return (data - data.mean()) / (data.max() - data.min())
我在其中传递每个a[...]
切片,然后再次将stack
的结果传递在一起。
是否有更好的方法以我描述的方式正确规范我的数据?
答案 0 :(得分:0)
尝试一下:
import pandas as pd
x =[[[9.9771e-01, 6.6219e-02, 8.6409e-03, 1.1918e-05, 2.3837e-05],
[9.9771e-01, 6.6219e-02, 8.6409e-03, 1.1918e-05, 2.3837e-05]],
[[9.9525e-01, 9.6969e-02, 7.5091e-03, 1.0301e-05, 3.0902e-05],
[9.9802e-01, 6.2234e-02, 7.8646e-04, 2.0696e-05, 1.0348e-05]],
[[9.7093e-01, 2.3617e-01, 3.2587e-02, 0.0000e+00, 0.0000e+00],
[9.7418e-01, 2.2391e-01, 5.7788e-03, 6.0829e-05, 9.1244e-05]],
[[9.9781e-01, 6.4524e-02, 1.8817e-03, 1.8268e-05, 0.0000e+00],
[9.9153e-01, 1.2825e-01, 1.0527e-02, 0.0000e+00, 3.8630e-05]]]
for b in x:
df = pd.DataFrame(b).transpose()
normalized_df=(df-df.min())/(df.max()-df.min())
print(normalized_df)