r - 如何围绕预测模型中的均值？

我正在使用来自14个不同研究的个体参与者数据制作预测模型。我们选择了年龄，BMI和两个临床变量（激素水平和超声检查结果）作为预测二元结局的指标。

我们将R https://rdrr.io/cran/psfmi/src/R/psfmi_mm.R中的psfmi软件包与psfmi_mm函数一起使用（“用于多级的池和预测变量选择函数使用随机效应进行研究的多个估算数据集中的＃'个模型。

现在，我们希望以均值为中心，但是我们还不完全了解如何执行此操作以及这在预测模型中如何工作。据我了解，首先您要减去每个人的总体平均值（=总数据库的平均值）。例如，如果我的研究的平均值为33岁，而我的36年研究1中有一名患者A，而36年的研究2中有一名患者B，则这两个变量的新变量AgeGM均为3。那么，您计算每个研究的新平均值。例如，如果研究1（针对年轻女性的研究）的平均年龄为31岁，则研究1的研究中心平均值为-2。与研究2的老年女性相同：如果平均年龄为40岁，则研究中心的平均值为4。现在，我想为每个研究计算每个患者的新变量，但是我不确定是否必须减去或增加研究平均值。例如，对于女人A，它将是3 + -2 =1。对于女人B，它将是3 + 4 =7。这是正确的吗？

第二，如果我想建立一个预测模型，我已经读到我应该合并两个新变量：每个人的新值（因此对于人A 1和对于人B 7）以及一个具有新平均值的变量。研究（因此对于人A -2和对于人2 4为4；对于研究2中的每个人为4）。但是，如果我要将模型合并到新的中心中，则我们不知道学习中心的平均值。我们该如何处理？

如何围绕预测模型中的均值？

0 个答案: