连续和分类数据的回归

时间:2015-05-18 23:23:01

标签: machine-learning data-mining

我还是机器学习领域的初学者。假设有这样的简单数据:

+--------+--------+-----------------+
| Age    | Gender | Mortality Rates |
+--------+--------+-----------------+
|      0 | Male   | 0.01            |
|     30 | Female | 0.2             |
|     80 | Male   | 30              |
+--------+--------+-----------------+

要按年龄获得死亡率,我们可以使用回归,按性别我们使用分类。将它们组合在一个机器学习算法中以产生输出预测的常用方法是什么?

1 个答案:

答案 0 :(得分:1)

你混淆了两件事:

  1. 输入数据类型

    您有分类(性别)和离散数字特征(年龄)。

  2. 学习任务

    分类:分类特征的预测。回归:预测数字特征。

  3. 例如,决策树最适合用于分类的分类输入。 SVM对数值数据进行分类。 SVR是SVM的回归变体。

    我已更新您的问题标题。

    您应该尝试的方法是将您的类别编码为二进制属性(例如男性:1,女性0),然后进行常规回归。