我导入了一个csv文件,其中包含对3个变量,CASEID,DEGREE和HRS1的2044个观测值。 前6个观察结果如下:
head(degree.wrk)
CASEID DEGREE HRS1
1 53044 3 55
2 53045 3 45
3 53046 0 -1
4 53047 0 -1
5 53048 0 -1
6 53049 0 -1
我想创建一个基于DEGREE的二分变量,它决定一个人是否赚到了 至少是学士学位。根据码本,DEGREE值大于或等于3表示获得的学士学位最低。如果满足最小值,我希望它返回“是”,如果没有,我希望它返回“否”。我使用了ifelse()函数,它看起来有效,但是我想知道在尝试创建二分变量时,或者如果我只是简单地替换了或者是否使用YES或NO类别标签替换DEGREE的数值是正确的操作重新编码现有变量。
ifelse()函数的结果如下:
degree.wrk$DEGREE <- ifelse(degree.wrk$DEGREE >=3,
c("Yes"),
c("No"))
head(degree.wrk)
CASEID DEGREE HRS1
1 53044 Yes 55
2 53045 Yes 45
3 53046 No -1
4 53047 No -1
5 53048 No -1
6 53049 No -1
关于我是否使用这种方法充分创建了二分变量的任何建议?