我想使用MLR以通用方式处理更大的数据集,特别是使用impute和reimpute函数。 由于必须填充数据和数据集的大小,因此我想知道一些假设需要花费多长时间的细节。
有人知道一种解决方案吗?
所以基本上,我希望‘mlr:impute()’具有'Verbose = TRUE'功能,该功能不存在。
致谢
答案 0 :(得分:2)
很遗憾,目前不支持此功能,并且没有计划添加它。原因是很难预测这种操作将花费多长时间-实际上,这本身就是机器学习问题。 mlr用于插值和其他目的的大多数技术都是由第三方库提供的,因此无法轻松提取进度信息。
即使我们能够以合理的精度预测一次操作所花费的时间,这样做的开销也会使短时间的操作更加缓慢,并且需要更多的内存。即使在这种情况下,结果也因计算机而异(会耗尽内存吗?),进一步使可靠的部署复杂化。