标准化非常不同的机器学习量表量表

时间:2019-07-16 11:26:51

标签: machine-learning deep-learning

我有一个数据集,其中每个条目的列比例都非常不同:

Input columns:
colA: range: 12-70
colB: range: 30-1500
colC: range: 0-12

Sample Inputs:
[A,  B,    C]
[22, 1500, 7]
[70, 900,  5]
[34, 413,  11]...

我应该按列或按条目归一化吗?

每列我的意思是,获取每列的最小值-最大值 是Max:A:70,B:1500,C:12,结果是条目:

A:22/70 | B:1500/1500 | C7/12:
[22, 1500, 7] to:
[0.31, 1, 0.58]

每个条目?

22 + 1500 + 7 = 1529
A:22/1529 | 1500/1529 | 7/1529
[22, 1500, 7] to: 
[0.0143, 0.9810, 0.0045]

还是所有值的最小值-最大值?

min:0, max: 1500
22/1500, 1500/1500, 7/1500
[22, 1500, 7] to: 
[0.0146, 1, 0.0046]

0 个答案:

没有答案