我的数据框简化如下:
head(dendro)
X DateTime ID diameter dendro ring DOY month mday year Rain_mm_Tot Through_Tot temp
1 1 2012-06-21 13:45:00 r1_1 5482 1 1 173 6 22 113 NA NA NA
2 2 2012-06-21 13:45:00 r2_3 NA 3 2 173 6 22 113 NA NA NA
3 3 2012-06-21 13:45:00 r1_2 5534 2 1 173 6 22 113 NA NA NA
4 4 2012-06-21 13:45:00 r2_4 NA 4 2 173 6 22 113 NA NA NA
5 5 2012-06-21 13:45:00 r1_3 5606 3 1 173 6 22 113 NA NA NA
6 6 2012-06-21 13:45:00 r2_5 NA 5 2 173 6 22 113 NA NA NA
数据帧首先按“ID”分割,因此它是ID列表 之后,我应用了一个包含循环的函数,结果是一个新列“Diameter2”,我希望从函数中获得结果,该函数运行正常:
dendro_sp <- split(dendro, dendro$ID)
library(changepoint)
dendro_sp <- lapply(dendro_sp, function(x){
x <- subset(x, !is.na(diameter))
cpfit <- cpt.mean(x$diameter, method="BinSeg")
x$diameter2 <- x$diameter
cpts <- cpfit@cpts
means <- param.est(cpfit)$mean
meanZero <- means[1]
for(i in 1:(length(cpts)-1)){
x$diameter2[(cpts[i]+1):cpts[i+1]] <- x$diameter2[(cpts[i]+1):cpts[i+1]] + (meanZero - means[i+1])
}
return(x)
})
dendro2 <- do.call(rbind, dendro_sp)
rownames(dendro2) <- NULL
我的问题是我希望它有条件地应用它,例如r1_1和r1_3,并在新列“diameter2”中获取r3的“diameter”值,而不是为其余ID应用函数:
ifelse(diameter$ID==c("r1_1","r1_3"), apply_the_function_to_r11_and_r13_to_calculate_diameter2, otherwise_write_diameter_value_in_diameter2_column)
请记住,数据框“dendro”是按ID分割的,我不知道为多个ID定义条件是否很重要。 感谢
答案 0 :(得分:0)
我不确定我是否正确理解了这个问题。我试着回答。 我假设你想将一个函数应用于“直径”data.frame的“diameter”字段,调整“ID”字段并将结果重新返回到相应的diameter2字段。我不知道这个功能是如何工作的,所以如果这不起作用,请原谅我。
直径$ diameter2 [直径$ ID ==“r1_1”|直径$ ID ==“r1_3”]&lt; - yourfun(直径$ diameter [直径$ ID ==“r1_1”|直径$ ID ==“r1_3 “]
直径$ diameter2 [直径$ ID!=“r1_1”&amp;直径$ ID ==“r1_3”]&lt; - 直径$ diameter [直径$ ID ==“r1_1”|直径$ ID ==“r1_3”]