我有样本数据(230条记录),如下所示:
Salary Success - Failure
23,300 1
44,000 1
12,400 0
23,000 1
55,000 0
…
Success =1
Fail = 0
我正在尝试将连续变量(薪水)与二元变量相关联(成功 - 失败 - 依赖) 我需要使用点 - 双列相关的上述数据集的样本R代码。
答案 0 :(得分:0)
如果数据框名称为df
biserial.cor(Salary,Success, level=2)
或
X = df$Salary
Y = df$Success
a = sqrt(sum(Y)*(length(Y)-sum(Y))/(length(Y)**2))
point.bis.corr = a*(mean(X[Y==1])-mean(X[Y==0]))/sd(X)
point.bis.corr