假设数据集包含连续变量和二元变量。通常,标签/结果列被转换为一个热矢量,而连续变量可以被标准化。但是需要对二进制变量应用什么。
AGE RACE GENDER NEURO EMOT 15.95346 0 0 3 1 14.57084 1 1 0 0 15.8193 1 0 0 0 15.59754 0 1 0 0
这如何适用于逻辑回归和神经网络?
答案 0 :(得分:1)
如果连续值的范围很小,则将其编码为二进制形式,并使用该二进制形式的每个位作为预测器。 例如,数字2 =二进制10。 因此
predictor_bit_0 = 0
predictor_bit_1 = 1
尝试看看它是否有效。只是为了警告你,这种方法非常主观,可能会或可能不会为您的数据产生良好的结果。如果我找到更好的解决方案,我会随时向您发布