我有一个数据集,其中每个条目的列比例都非常不同:
Input columns:
colA: range: 12-70
colB: range: 30-1500
colC: range: 0-12
Sample Inputs:
[A, B, C]
[22, 1500, 7]
[70, 900, 5]
[34, 413, 11]...
我应该按列或按条目归一化吗?
每列我的意思是,获取每列的最小值-最大值 是Max:A:70,B:1500,C:12,结果是条目:
A:22/70 | B:1500/1500 | C7/12:
[22, 1500, 7] to:
[0.31, 1, 0.58]
每个条目?
22 + 1500 + 7 = 1529
A:22/1529 | 1500/1529 | 7/1529
[22, 1500, 7] to:
[0.0143, 0.9810, 0.0045]
还是所有值的最小值-最大值?
min:0, max: 1500
22/1500, 1500/1500, 7/1500
[22, 1500, 7] to:
[0.0146, 1, 0.0046]