我们希望训练R的结构如下: 年龄,数据1,数据2,...数据N,行动
其中N取决于我们对某人的数据量。
我们的目标是通过查询我们拥有的所有数据来确定另一个人产生行动的可能性。
age,data1,data2,... dataM其中M可能大于或小于N.
使用完整的数据集,我们可以使用二进制逻辑回归。但是我们需要使用部分集。
通过询问部分数据集来计算某人执行操作的可能性的最佳方法是什么?
答案 0 :(得分:1)
Hmisc软件包提供多种插补功能,提供了一种更完整地使用数据中存在的信息的方法。
require(Hmisc)
?aregImpute # with several worked examples
随附的软件包rms具有二进制逻辑回归函数:
require(rms)
?lrm