“我正在运行线性回归模型,当我运行模型后,我运行“摘要”以获取该模型的统计信息,例如R平方,调整后R平方和其他用于分析问题,我有11个自变量和1个因变量,在10个自变量中,有7个因子变量和4个连续变量。因变量也是连续变量。
The factor variables are
Position - 8 levels
Operating level - 10 levels
Region - 24 levels
Gender - 2 levels
Locale - 29 levels
RM - 2 levels
OPR - 6 levels
让我们考虑由24个级别组成的数据集“ Region”中的因子变量。我们知道,第一级按字母顺序被删除。因此,最终的级别应该为23。但是问题是,除了必须强制删除的级别之外,还删除了另外一个级别。我们无法弄清为什么要删除该特定级别。
我写了一个R代码来运行线性回归。以下是实现线性回归的代码:
LinReg <- lm(LS~.,data = result)
然后要获得详细的摘要,我使用以下语句:
summary(LinReg)
现在,当我们看到摘要的输出时,将提供有关系数的详细说明。在“区域”变量中,有24个级别。一个应该被强制删除。但是,另一个级别正在被删除。假设该区域的级别为“ Bedy BOD”,则该数据中有两条记录,这对于数据分析非常重要。
result <- datadf
LinReg <- lm(LS~.,data = result)
summary(LinReg)
anova(LinReg)
为什么在此过程中又删除了一个级别?