使用Proc Logistic / Proc GAM

时间:2017-01-09 17:05:33

标签: sas logistic-regression gam

在我的数据集中,由不同范围表示的变量表示Female_Age_Band为15-20,20-25,25-30,...&但问题是,在数据不可用的地方,特定观察被标记为“不可用”,这使得将该字段作为字符读取。因此,我认为这将使得在逻辑回归中调用该变量变得困难。此外,还存在某些分类字段,其具有3个不同的指示符0 1& 2.甚至这些字段都有“不可用”标签。在技术上不能用零替换,因为零可能是有效值。

有人可以帮忙解决方案吗?

1 个答案:

答案 0 :(得分:0)

问题大于"不可用"因为" 15-20"也将被视为角色。但是你不想用中间值替换它们,因为这会使事情变得很奇怪。你没有XXX 17.5岁的人。

我要做的是使用数据步骤将数据重新编码为在每个年龄段内均匀分布并重新编码"不可用" as。

(抱歉,我刚买了一台新电脑,正在等待新的SAS安装,所以我现在无法显示代码)。