我想在R中创建一个函数,它将输出从数据框中的原始变量派生的标志变量,然后理想地输出数据框中的每个变量。
我想为数据框中的每个变量创建一个新变量,如果原始变量值为NA,则该值将等于1,如果不是NA,则该值将等于0。
我还想调用新变量与原始变量相同,除了前缀为" M _"在它之前。
以下是一个例子:
INDEX HEIGHT LENGTH
1 70 55
2 60 NA
3 NA 35
4 NA NA
我希望输出看起来像这样:
INDEX HEIGHT M_HEIGHT LENGTH M_LENGTH
1 70 0 55 0
2 60 0 NA 1
3 NA 1 35 0
4 NA 1 NA 1
我目前正在为每个变量单独执行此操作,但我想加快速度,而不必一遍又一遍地重复相同的事情。
df$M_HEIGHT <- ifelse(is.na(HEIGHT),1,0)
答案 0 :(得分:2)
&#34; [&lt; - &#34;函数可以按名称创建(分配)新列:
> dat[ , paste0( "M_",names(dat)[-1])] <-
lapply(dat[-1], function(x) as.numeric(is.na(x)) )
> dat
INDEX HEIGHT LENGTH M_HEIGHT M_LENGTH
1 1 70 55 0 0
2 2 60 NA 0 1
3 3 NA 35 1 0
4 4 NA NA 1 1
由于您想为is.na逻辑测试分配预期的0/1值,因此不需要ifelse
。如果测试或值范围更复杂,您可以使用ifelse
。