使用一个热编码时的逻辑回归方程

时间:2015-11-11 07:40:55

标签: machine-learning linear-regression logistic-regression

当功能是数字时,如下所示:

enter image description here

假设sigmoid(transpose(theta).X))中的特征矩阵X将是:

enter image description here

然而,当我们在这里有另外一个功能 - 颜色,可以是红色或蓝色或绿色时,在执行一个热编码时,每个都将是一个矢量,如:[1 0 0] {{ 1}}和[0 1 0]

我无法弄清楚如何将这些 One Hot Encoding 向量合并到已存在的要素矩阵中,然后在等式假设中使用它

1 个答案:

答案 0 :(得分:1)

是的,你应该从数据集中删除所有未编码的分类特征,对它们进行编码并从一个热编码中添加它们的编码值,当然你也必须将相应的权重添加到theta中。然后,您可以在新的数据集

上拟合新模型