我在R中进行逻辑回归苦苦挣扎。我有一个相当复杂的数据框(具有15.550个观察值),并尝试进行逻辑回归,其中结果非常出乎意料,并且对于以前的研究结果(每个输入变量都不切实际)在0.01的间隔内是显着的)。这就是为什么我尝试使用非常基本的变量来测试我的方法的原因:
因变量(strat)是专利申请是否具有战略意义(1)或不是(0),并被定义为具有两个级别的因子,使其具有资格作为基本二元逻辑回归的因变量。
自变量Decl.lag是一个连续的数字变量,范围是2到2700,代表天。
现在要说的是,我之前是根据天数得出该strat变量的。因此,在2-123天之间,该观察被宣布为策略性(1),在124-2700天之间,该观察被宣布为非策略性(0)。这就是为什么我认为这是测试我对如何使用strat作为因变量对我的数据集应用逻辑回归的基本理解的理想方案(当然,我实际上想测试除定义变量strat的日子以外的其他变量) 。因此,所有低于123的Decl.Lag值都产生1,高于123的所有Decl.Lag值都产生0。我期望结果是完全有意义的,但实际上不是。运行回归的代码如下:
logTest <- glm(strat ~ Decl.lag, family = "binomial", data = decls_long)
summary(logTest)
我得到的输出是:
Deviance Residuals:
Min 1Q Median 3Q Max
-0.003271 0.000000 0.000000 0.000000 0.003138 `
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3008.48 6400.08 0.47 0.638
Decl.Lag -24.36 51.83 -0.47 0.638
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1.7505e+04 on 15549 degrees of freedom
Residual deviance: 1.0963e-03 on 15548 degrees of freedom<code>
有人可以说明我对这种数据如何应用逻辑回归的任何基本误解吗? 提前非常感谢您的帮助!