如何从配方中排除某些变量?

时间:2018-09-03 13:31:10

标签: r r-caret r-recipes

使用step_regex函数为模型构建配方时,它将为原始列中的某些模式创建其他列。完成操作后,是否可以从配方中排除原始列?

例如,在下面的示例中,产品既包含原始的description列,又包含两个由step_regex新创建的列。我想要一个与recipe对象集成的解决方案,以便可以直接在caret::train中使用它。

library(recipe)
data(covers)

rec <- recipe(~ description, covers) %>%
  step_regex(description, pattern = "(rock|stony)", result = "rocks") %>%
  step_regex(description, pattern = "ratake families")

rec2 <- prep(rec, training = covers)

with_dummies <- bake(rec2, newdata = covers)

1 个答案:

答案 0 :(得分:1)

找到解决方案。我想我可以更改不想用作预测变量的列的作用。

rec <- rec %>% add_role(description, new_role = "dont_use")