我对R和计量经济学一般都很新,但我似乎无法在其他任何地方找到有用的答案。
我试图看看某个自我报告的因素是否有助于解释亚裔美国人的收入而不仅仅是教育。我为该因素创建了一个虚拟变量:
american.typical <- as.numeric(PewData$q24 == "Typical American")
收入分为九个类别和一个不答复类别,教育分为七个类别和一个不答复类别。
我最初为每个收入类别创建了一个虚拟变量,但后来我发现了GLM函数并认为它可能是不必要的。但是,我以这种方式尝试的所有命令:
glm(PewData$income ~ PewData$educ)
glm(PewData$income ~ american.typical)
返回:
Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, :
NA/NaN/Inf in 'y'
In addition: Warning messages:
1: In Ops.factor(y, mu) : ‘-’ not meaningful for factors
2: In Ops.factor(eta, offset) : ‘-’ not meaningful for factors
3: In Ops.factor(y, mu) : ‘-’ not meaningful for factors
此外,我试图制作的任何情节都是完全无益的,这让我相信我在我的方法中误入歧途而不是执行。
非常感谢任何建议。
编辑:我也通过this method尝试了逻辑回归,但无济于事。