添加一个虚拟变量

时间:2018-06-28 08:33:52

标签: r statistics regression logistic-regression

我已经阅读了很多有关伪变量的信息,这似乎是个好主意...但是我想知道在有两列,其中一列是YEARS('1',' 2','3+')和MONTHS(0-12)。

到目前为止,我的想法是:
A)将两者合并为1个变量(“ 1”,“ 2”,“ 3”,“ 4+”),并进行一些舍入

B)为“ 3+”创建一个虚拟变量(“ 3+”的标志为1,否则为0),然后使用公式YEARS +(MONTHS / 12)将所有非“ 3+”的内容与months列组合在一起

我认为选项B更好,但是如何处理YEARS +(MONTHS / 12)列中包含“ 3+”的行?

0 个答案:

没有答案