分配给is.na(clinical.trial $ age)

时间:2017-06-14 12:13:40

标签: r assignment-operator

我正在查看代码from here,它在开头有这个:

## generate data for medical example 
clinical.trial <-
    data.frame(patient = 1:100,
               age = rnorm(100, mean = 60, sd = 6),
               treatment = gl(2, 50,
                 labels = c("Treatment", "Control")),
               center = sample(paste("Center", LETTERS[1:5]), 100, replace = 
TRUE))

## set some ages to NA (missing) 
is.na(clinical.trial$age) <- sample(1:100, 20)

我无法理解这最后一行。         LHS是所有FALSE值的向量。 RHS是从载体1:100中选择的20个数的向量。 我不明白这种任务。这导致clinical.trial$age获得某些NA值的结果如何?这种作业有名字吗?充其量我会说RHS上的布尔向量通过回收获得分配给它的数字。

3 个答案:

答案 0 :(得分:5)

is.na(x) <- value被翻译为'is.na<-'(x, value)

您可以将'is.na<-'(x, value)视为&{39}将NA分配给x,位置value&#39;。

可能更好,更直观的措辞可能是assign_NA(to = x, pos = value)

关于其他类似的功能,我们可以在基础包中找到它们:

x <- as.character(lsf.str("package:base"))
x[grep('<-', x)]
#>  [1] "$<-"                     "$<-.data.frame"         
#>  [3] "@<-"                     "[[<-"                   
#>  [5] "[[<-.data.frame"         "[[<-.factor"            
#>  [7] "[[<-.numeric_version"    "[<-"                    
#>  [9] "[<-.data.frame"          "[<-.Date"               
#> [11] "[<-.factor"              "[<-.numeric_version"    
#> [13] "[<-.POSIXct"             "[<-.POSIXlt"            
#> [15] "<-"                      "<<-"                    
#> [17] "attr<-"                  "attributes<-"           
#> [19] "body<-"                  "class<-"                
#> [21] "colnames<-"              "comment<-"              
#> [23] "diag<-"                  "dim<-"                  
#> [25] "dimnames<-"              "dimnames<-.data.frame"  
#> [27] "Encoding<-"              "environment<-"          
#> [29] "formals<-"               "is.na<-"                
#> [31] "is.na<-.default"         "is.na<-.factor"         
#> [33] "is.na<-.numeric_version" "length<-"               
#> [35] "length<-.factor"         "levels<-"               
#> [37] "levels<-.factor"         "mode<-"                 
#> [39] "mostattributes<-"        "names<-"                
#> [41] "names<-.POSIXlt"         "oldClass<-"             
#> [43] "parent.env<-"            "regmatches<-"           
#> [45] "row.names<-"             "row.names<-.data.frame" 
#> [47] "row.names<-.default"     "rownames<-"             
#> [49] "split<-"                 "split<-.data.frame"     
#> [51] "split<-.default"         "storage.mode<-"         
#> [53] "substr<-"                "substring<-"            
#> [55] "units<-"                 "units<-.difftime"

'fun<-'(x, val)相当于fun(x) <- val的意义上,所有工作方式都相同。但在那之后它们都表现得像任何正常的功能。

R手册:3.4.4 Subset assignment

答案 1 :(得分:0)

帮助告诉我们:

(xx <- c(0:4)) 
is.na(xx) <- c(2, 4)
xx                     #> 0 NA  2 NA  4

所以,

is.na(xx) <- 1

表现得更像

set NA at position 1 on variable xx

答案 2 :(得分:0)

@马特,在评论中回答您上面提到的问题,这里有另一种方法来执行我认为更容易遵循的相同任务: - )

clinical.trial$age[sample(1:100, 20)] <- NA