R - 在if循环中使用某个语句替换值,并在同一个df

时间:2017-09-05 14:21:54

标签: r replace

我有一个数据集,我想用它进行多级分析。因此,每个患者都有两排,还有一排有1和2的患者(1 =患者,2 =患者的伴侣)。

现在,对于现在位于同一行的不同列中的患者和伴侣,我有出生日期和年龄的变量。 我想要做的是编写一个代码:

if mydata$couple == 2, then replace mydata$dateofbirthpatient with mydata$dateofbirthpatient

每一行都是如此。因为我想要替换多个变量,所以如果我能在循环中得到它并且只是添加'那将是可爱的。我想要替换的变量。

到目前为止我尝试了什么:

 mydf_longer <- if (mydf_long$couple == 2) {
  mydf_long$pgebdat <- mydf_long$prgebdat
 } 

当然这不起作用 - 但简单地说这就是我想要的。

我开始使用此代码,遵循By row, replace values equal to value in specified column中的示例 ,但不知道如何完成:

mydf_longer[6:7][mydf_longer[,1:4]==mydf_longer[2,2]] <- 

有什么想法吗?如果您需要更多信息,请与我们联系。

数据示例:

#     id couple groep_MNC zkhs fbeh    pgebdat    p_age pgesl   prgebdat pr_age
# 1    3      1         1    1    1 1955-12-01 42.50000     1       <NA>     NA
# 1.1  3      2         1    1    1 1955-12-01 42.50000     1       <NA>     NA
# 2    5      1         1    1    1 1943-04-09 55.16667     1 1962-04-18   36.5
# 2.1  5      2         1    1    1 1943-04-09 55.16667     1 1962-04-18   36.5
# 3    7      1         1    1    1 1958-04-10 40.25000     1       <NA>     NA
# 3.1  7      2         1    1    1 1958-04-10 40.25000     1       <NA>     NA

mydf_long <- structure(
  list(id = c(3L, 3L, 5L, 5L, 7L, 7L),
       couple = c(1L, 2L, 1L, 2L, 1L, 2L),
       groep_MNC = c(1L, 1L, 1L, 1L, 1L, 1L),
       zkhs = c(1L, 1L, 1L, 1L, 1L, 1L),
       fbeh = c(1L, 1L, 1L, 1L, 1L, 1L),
       pgebdat = structure(c(-5145, -5145, -9764, -9764, -4284, -4284), class = "Date"),
       p_age = c(42.5, 42.5, 55.16667, 55.16667, 40.25, 40.25),
       pgesl = c(1L, 1L, 1L, 1L, 1L, 1L),
       prgebdat = structure(c(NA, NA, -2815, -2815, NA, NA), class = "Date"),
       pr_age = c(NA, NA, 36.5, 36.5, NA, NA)),
  .Names = c("id", "couple", "groep_MNC", "zkhs", "fbeh", "pgebdat",
             "p_age", "pgesl", "prgebdat", "pr_age"),
  row.names = c("1", "1.1", "2", "2.1", "3", "3.1"),
  class = "data.frame"
)

1 个答案:

答案 0 :(得分:1)

如果您只想根据条件更改值,则以下for循环应该有效:

for(i in 1:nrow(mydata)){
  if(mydata$couple[i] == 2){
    mydata$pgebdat[i] <- mydata$prgebdat[i]
  }
}

OR

正如@lmo建议的那样,以下工作会更快。

mydata$pgebdat[mydata$couple == 2] <- mydata$prgebdat[mydata$couple == 2]