我有一个数据框,其中三列代表三次重复测量:
IDPupil 1 2 3
1 150.5 151.0 150.6
2 156.3 156.5
3 145.7 146.0
4 151.4 151.6
5 150.0 149.5 150.4
我想通过根据以下内容计算三次测量的行平均值(或中位数)来创建一个新变量:
a)如果col 1和col 2之间的差异> 0.4并且col 3中存在值,则计算行中值。 b)如果col 1和col 2之间的差值> 0.4并且col 3中没有值打印“NULL” c)在所有其他情况下(即第1列和第2列之间的差异<0.4),计算行平均值。
我尝试了以下内容:
Hdiff= hwdata$Height1 - hwdata$Height2
Hdiff2 = abs(Hdiff)
Hdiff2
MeanH = if(Hdiff2 > 0.4 && hwdata$Height3 > 0) {
rowMedians(hwdata[, c("Height1", "Height2", "Height3")], na.rm = TRUE)
} else if(Hdiff2 > 0.4 & hwdata$Height3 == 0)
MeanH = "NULL"
}else rowMeans (hwdata [, c("Height1", "Height2", "Height3")], na.rm = TRUE)
{
我收到错误:
'Error: could not find function "rowMedians"'
和
'Error: unexpected '}' in "}"'
R经验= 1周。是否有更简约的方式来做这件事?
答案 0 :(得分:1)
根据您提供的数据,这有效:
dt<-read.table(text="IDPupil 1 2 3
1 150.5 151.0 150.6
2 156.3 156.5 NA
3 145.7 146.0 NA
4 151.4 151.6 NA
5 150.0 149.5 150.4",h=T)
> ifelse(abs(dt$X1-dt$X2)<0.4,rowMeans(dt[,-1],na.rm=T),apply(dt[,-1],1,median))
[1] 150.60 156.40 145.85 151.50 150.00
如果您的列名称为Height1
等,则需要将X1
更改为Height1
等。