我有一个R函数,该函数接收一些包含缺失值的输入数据,使用随机森林插补来插补这些值(通过RandomForest包中的rfImpute函数),然后进行RF重要性计算以识别变量的相对重要性(通过护林员包中的护林员)。该函数具有种子2018。
当我使用带有set.seed(2018)的R运行该函数时,会得到一组结果。当运行完全相同的功能,完全相同的输入数据以及在PL / R中使用完全相同的种子(使用Navicat)时,结果是不同的。
我很难理解可能导致此问题的原因,因为两者之间完全相同(除了一个是R,另一个是PL / R)。对于某些输入数据集,结果是等效的,而对于其他输入数据集则不是。可能是什么问题?
注意:由于我的数据是机密的,因此我无法提供一个简单的示例。