我的原始数据包含一些缺失值,因此我使用了多个插补来填充它们。我的下一个目标是在SVM和ANN中使用这些数据。我原本以为MI会给我一个“汇集的”完整数据集,但事实证明MI只能提供有关估算数据集的汇总分析结果。所以我的问题是: 1)有没有办法像方程式一样,可以将估算的数据集聚合到一个数据集中,并用于进一步的分析; 2)如果没有,应该如何使用多个数据集进行研究。 谢谢!
答案 0 :(得分:0)
这是对MI的普遍误解。
一般过程应该是这样的:
如果要进行插补,然后将所有插补数据集合并到一个插补数据集中,则会失去MI的所有优势。这样您就可以使用任何其他插补方法。这个想法是要执行5次分析,每个估算数据集一次。因为您要考虑不同的结果,所以您的分析可能具有不同的估算输入数据集。之后,您合并/合并分析结果。 整个过程在ML中并不常见。但是例如,您可以在所有5个数据集上使用SVM,然后比较结果/提出合并/组合结果的过程。