在R中创建变量的多个条件

时间:2013-10-14 16:41:35

标签: r dataframe conditional

我有一个数据框,其中三列代表三次重复测量:

IDPupil    1       2       3
1        150.5   151.0   150.6    
2        156.3   156.5            
3        145.7   146.0            
4        151.4   151.6            
5        150.0   149.5   150.4    

我想通过根据以下内容计算三次测量的行平均值(或中位数)来创建一个新变量:

a)如果col 1和col 2之间的差异> 0.4并且col 3中存在值,则计算行中值。 b)如果col 1和col 2之间的差值> 0.4并且col 3中没有值打印“NULL” c)在所有其他情况下(即第1列和第2列之间的差异<0.4),计算行平均值。

我尝试了以下内容:

Hdiff= hwdata$Height1 - hwdata$Height2
 Hdiff2 = abs(Hdiff)
 Hdiff2

MeanH = if(Hdiff2 > 0.4 && hwdata$Height3 > 0) {
rowMedians(hwdata[, c("Height1", "Height2", "Height3")], na.rm = TRUE)

} else if(Hdiff2 > 0.4 & hwdata$Height3 == 0)
MeanH = "NULL"

}else rowMeans (hwdata [, c("Height1", "Height2", "Height3")], na.rm = TRUE)
{

我收到错误:

'Error: could not find function "rowMedians"'

'Error: unexpected '}' in "}"'

R经验= 1周。是否有更简约的方式来做这件事?

1 个答案:

答案 0 :(得分:1)

根据您提供的数据,这有效:

dt<-read.table(text="IDPupil    1       2       3
1        150.5   151.0   150.6    
2        156.3   156.5   NA         
3        145.7   146.0   NA         
4        151.4   151.6   NA         
5        150.0   149.5   150.4",h=T)
> ifelse(abs(dt$X1-dt$X2)<0.4,rowMeans(dt[,-1],na.rm=T),apply(dt[,-1],1,median))
[1] 150.60 156.40 145.85 151.50 150.00

如果您的列名称为Height1等,则需要将X1更改为Height1等。