我正在尝试从二进制变量列表中预测具有统计意义的变量。我在以下提到的两种找到相关变量的方法中存在概念上的疑问。
自变量: 一个人的身高
因变量:
方法1:拟合线性回归,同时将其作为因变量/自变量并找到具有统计意义的变量
方法2:对每个因变量(t检验或其他相关检验)执行单独的统计检验,以计算统计上显着的变量
这两种方法是否相似并且会给出相似的结果?如果没有,确切的区别是什么?
答案 0 :(得分:0)
由于您有多个自变量,因此显然没有。
如果您想对不同自变量(Gender,Financial_Status和College_Graduate)的每个值进行ttest方法测试,则意味着您将执行3种不同的测试。就误报结果而言,执行多次测试是有风险的,因此应使用多重比较调整方法(Bonferoni,FDR等)进行调整。
另一方面,如果您使用单个多元线性回归,那么多重比较就没有正确的选择,这就是为什么我认为是更好的方法。