在应用逻辑回归时选择要标准化的变量

时间:2017-01-10 05:02:06

标签: neural-network logistic-regression data-science

假设数据集包含连续变量和二元变量。通常,标签/结果列被转换为一个热矢量,而连续变量可以被标准化。但是需要对二进制变量应用什么。

AGE       RACE  GENDER  NEURO   EMOT
15.95346    0    0       3       1
14.57084    1    1       0       0
15.8193     1    0       0       0
15.59754    0    1       0       0

这如何适用于逻辑回归和神经网络?

1 个答案:

答案 0 :(得分:1)

如果连续值的范围很小,则将其编码为二进制形式,并使用该二进制形式的每个位作为预测器。 例如,数字2 =二进制10。 因此

predictor_bit_0 = 0

predictor_bit_1 = 1

尝试看看它是否有效。只是为了警告你,这种方法非常主观,可能会或可能不会为您的数据产生良好的结果。如果我找到更好的解决方案,我会随时向您发布