我正在尝试生成一个多元线性回归模型来预测连续变量的值。
我有很多具有潜在解释力的变量,有些是二元的(例如性别),有些是计数(例如孩子的数量),有些是连续的(例如身高)。所有变量都是非负数。
我正在努力的是,在我的一些计数变量中存在大量合法零值(例如,缺少天数)和我的一些连续变量(例如福利申请人的收入)我不能使用零膨胀泊松模型并非所有变量都是计数数据。
在不删除这些变量的情况下,创建此模型的最佳方法是什么?
不幸的是,由于我的数据集的性质和我工作的地方,我无法透露我实际想要建模的内容或我的变量是什么。我也不得不使用SAS来执行建模。
感谢任何帮助!