我是数据科学的新手
我目前正在为学生打分。
这些是数据集的特征
1- Gender
2- IQLevel
3- WritingScore
4- MathScore
数据样本
男C级98 93 B级男性62 70 女A级81 88 女D级53 48
在此数据集中,我试图根据其他功能预测数学得分
我正在使用Python线性回归算法
为此,我必须将Gender和IQLevel转换为数值
Gender : Male --> 1 Female --> 2
IQLevel Level A --> 1 Level B --> 2 Level C --> 3
Level D --> 4
预计智商与数学成绩相关 但是在IQ字段中,我们使用名义值(分类)
因此,通过以某种方式将IQLevel转换为数字,我们可能会获得IQLevel之间的关系,也可能不会
在第一个示例中
IQLevel Level A --> 1 Level B --> 2 Level C --> 3
Level D --> 4
没有线性关系
但是如果以另一种方式将转换更改为数字 我们得到线性关系
IQLevel Level D --> 1 Level B --> 2 Level A --> 3
Level C --> 4
将标称值更改为数值是否会对线性回归预测产生任何影响?