我正在使用配方包对机器学习模型的数据进行预处理。
如何将均值目标编码应用于数据集中的所有类别变量(大约70个变量)?
我尝试过
step_mutate(mean = ave(NumericResponseVariable,CategoricalPredictorVariable))
但我不知道如何在所有类别变量中执行此操作。 如果我在单个新数据点上烘焙,我也无法使它正常工作。
我知道dplyr中有一个mutate_all,但我不认为这是食谱中的步骤。
我还尝试过在“嵌入”包中使用step_lencode_glm,但是将其应用于70个变量会使运行时间非常长。
有什么想法吗?