预测名义值的数值的算法

时间:2019-03-02 14:02:13

标签: python classification linear-regression data-science

我是数据科学的新手

我目前正在为学生打分。

这些是数据集的特征

1- Gender

2- IQLevel

3- WritingScore

4- MathScore

数据样本

男C级98 93 B级男性62 70 女A级81 88 女D级53 48

在此数据集中,我试图根据其他功能预测数学得分

我正在使用Python线性回归算法

为此,我必须将Gender和IQLevel转换为数值

Gender : Male --> 1     Female --> 2

IQLevel Level A --> 1   Level B --> 2     Level C --> 3
    Level D --> 4

预计智商与数学成绩相关 但是在IQ字段中,我们使用名义值(分类)

因此,通过以某种方式将IQLevel转换为数字,我们可能会获得IQLevel之间的关系,也可能不会

在第一个示例中

IQLevel Level A --> 1   Level B --> 2     Level C --> 3
    Level D --> 4

没有线性关系

enter image description here

但是如果以另一种方式将转换更改为数字 我们得到线性关系

IQLevel Level D --> 1   Level B --> 2     Level A --> 3
    Level C --> 4

enter image description here

将标称值更改为数值是否会对线性回归预测产生任何影响?

0 个答案:

没有答案