我有一个非常混乱的数据集,需要进行预处理。 我想更改所有变量并手动添加级别信息,所以我试图制作一个使用mutate的循环。
我设法创建了一个列表,其中包含需要在数据框中更改的变量的行号(例如varstochange)。我还生成了两个列表,第一个列表具有此变量具有的级别(请参见levelnumbers),第二个列表具有要使用的标签(请参见levelnames)。
我对循环非常陌生,并且使用mutant编写方式来使用mutate变得越来越困难
tempdat<- data.frame(location=c("1","2","3","1","2","3","1","2","1"),job=c(1,0 ,1,0,1,0,1,0,1),age=c(12,12,13,14,15,13,1,14,14))
varstochange<-c(1,2)
levelnames<-list()
levelnames[[1]]=c("Europe","Africa","Asia")
levelnames[[2]]=c("yes","no")
levelnumbers<-list()
levelnumbers[[1]]=c("1","2","3")
levelnumbers[[2]]=c("0","1")
我试图写这样的东西,但是真的不确定从哪里开始以及如何告诉函数从三个独立的列表中选择元素并将其输入到mutate循环中。...
这是我被困住的地方。
for (i in 1:length(varstochange)){
input<-tempdat%>%
mutate(varstochange[i]=factor(tempdat[i],levels=c(unlist(levelnumbers[i])),l abels=c(unlist(levels_names[i])),order=TRUE))
}
最后,我希望有一个数据集,该数据集仅将变量的格式更改为“ varstochange”上的变量的格式,并且具有一个结构,其结构具有其他两个列表中定义的级别。
在进行这项工作时,我将不胜感激 谢谢!
答案 0 :(得分:1)
通常,您不需要,也不需要像这样dplyr
循环。尝试像这样使用recode
:
library(tidyverse)
tempdat <- tibble(
location = c("1", "2", "3", "1", "2", "3", "1", "2", "1"),
job = c(1, 0, 1, 0, 1, 0, 1, 0, 1),
age = c(12, 12, 13, 14, 15, 13, 1, 14, 14)
)
tempdat %>%
mutate(
location = recode(location, "1" = "Europe", "2" = "Africa", "3" = "Asia"),
job = recode(job, "1" = "yes", "0" = "no")
)
#> # A tibble: 9 x 3
#> location job age
#> <chr> <chr> <dbl>
#> 1 Europe yes 12
#> 2 Africa no 12
#> 3 Asia yes 13
#> 4 Europe no 14
#> 5 Africa yes 15
#> 6 Asia no 13
#> 7 Europe yes 1
#> 8 Africa no 14
#> 9 Europe yes 14
由reprex package(v0.2.1)于2019-03-22创建