使用函数在R中创建标志变量

时间:2015-03-15 18:53:54

标签: r function dataframe na

我想在R中创建一个函数,它将输出从数据框中的原始变量派生的标志变量,然后理想地输出数据框中的每个变量。

我想为数据框中的每个变量创建一个新变量,如果原始变量值为NA,则该值将等于1,如果不是NA,则该值将等于0。

我还想调用新变量与原始变量相同,除了前缀为" M _"在它之前。

以下是一个例子:

INDEX   HEIGHT    LENGTH
1       70        55
2       60        NA
3       NA        35
4       NA        NA

我希望输出看起来像这样:

INDEX   HEIGHT  M_HEIGHT  LENGTH  M_LENGTH
1       70      0         55      0
2       60      0         NA      1
3       NA      1         35      0
4       NA      1         NA      1

我目前正在为每个变量单独执行此操作,但我想加快速度,而不必一遍又一遍地重复相同的事情。

df$M_HEIGHT <- ifelse(is.na(HEIGHT),1,0)

1 个答案:

答案 0 :(得分:2)

&#34; [&lt; - &#34;函数可以按名称创建(分配)新列:

> dat[ , paste0( "M_",names(dat)[-1])] <- 
       lapply(dat[-1], function(x) as.numeric(is.na(x)) )
> dat
  INDEX HEIGHT LENGTH M_HEIGHT M_LENGTH
1     1     70     55        0        0
2     2     60     NA        0        1
3     3     NA     35        1        0
4     4     NA     NA        1        1

由于您想为is.na逻辑测试分配预期的0/1值,因此不需要ifelse。如果测试或值范围更复杂,您可以使用ifelse