我有一个数据集,我想用它进行多级分析。因此,每个患者都有两排,还有一排有1和2的患者(1 =患者,2 =患者的伴侣)。
现在,对于现在位于同一行的不同列中的患者和伴侣,我有出生日期和年龄的变量。 我想要做的是编写一个代码:
if mydata$couple == 2, then replace mydata$dateofbirthpatient with mydata$dateofbirthpatient
每一行都是如此。因为我想要替换多个变量,所以如果我能在循环中得到它并且只是添加'那将是可爱的。我想要替换的变量。
到目前为止我尝试了什么:
mydf_longer <- if (mydf_long$couple == 2) {
mydf_long$pgebdat <- mydf_long$prgebdat
}
当然这不起作用 - 但简单地说这就是我想要的。
我开始使用此代码,遵循By row, replace values equal to value in specified column中的示例 ,但不知道如何完成:
mydf_longer[6:7][mydf_longer[,1:4]==mydf_longer[2,2]] <-
有什么想法吗?如果您需要更多信息,请与我们联系。
数据示例:
# id couple groep_MNC zkhs fbeh pgebdat p_age pgesl prgebdat pr_age
# 1 3 1 1 1 1 1955-12-01 42.50000 1 <NA> NA
# 1.1 3 2 1 1 1 1955-12-01 42.50000 1 <NA> NA
# 2 5 1 1 1 1 1943-04-09 55.16667 1 1962-04-18 36.5
# 2.1 5 2 1 1 1 1943-04-09 55.16667 1 1962-04-18 36.5
# 3 7 1 1 1 1 1958-04-10 40.25000 1 <NA> NA
# 3.1 7 2 1 1 1 1958-04-10 40.25000 1 <NA> NA
mydf_long <- structure(
list(id = c(3L, 3L, 5L, 5L, 7L, 7L),
couple = c(1L, 2L, 1L, 2L, 1L, 2L),
groep_MNC = c(1L, 1L, 1L, 1L, 1L, 1L),
zkhs = c(1L, 1L, 1L, 1L, 1L, 1L),
fbeh = c(1L, 1L, 1L, 1L, 1L, 1L),
pgebdat = structure(c(-5145, -5145, -9764, -9764, -4284, -4284), class = "Date"),
p_age = c(42.5, 42.5, 55.16667, 55.16667, 40.25, 40.25),
pgesl = c(1L, 1L, 1L, 1L, 1L, 1L),
prgebdat = structure(c(NA, NA, -2815, -2815, NA, NA), class = "Date"),
pr_age = c(NA, NA, 36.5, 36.5, NA, NA)),
.Names = c("id", "couple", "groep_MNC", "zkhs", "fbeh", "pgebdat",
"p_age", "pgesl", "prgebdat", "pr_age"),
row.names = c("1", "1.1", "2", "2.1", "3", "3.1"),
class = "data.frame"
)
答案 0 :(得分:1)
如果您只想根据条件更改值,则以下for
循环应该有效:
for(i in 1:nrow(mydata)){
if(mydata$couple[i] == 2){
mydata$pgebdat[i] <- mydata$prgebdat[i]
}
}
OR
正如@lmo建议的那样,以下工作会更快。
mydata$pgebdat[mydata$couple == 2] <- mydata$prgebdat[mydata$couple == 2]