我有这个数据框:
df <- read.table(text="
date1 date2
1 NA 2016-12-01
2 2017-01-01 2018-10-01
3 2016-12-01 NA
4 NA NA
", header=TRUE)
我需要创建新的“ max_date”列,其中将包含最大的date1 / date2列。请注意,在某些行中是NA值,在某些情况下,两列中都是NA。
我试图通过一些if_else来实现,但是代码太复杂了。结果应为
result <- read.table(text="
date1 date2 max_date
1 NA 2016-12-01 2016-12-01
2 2017-01-01 2018-10-01 2018-10-01
3 2016-12-01 NA 2016-12-01
4 NA NA NA
", header=TRUE)
答案 0 :(得分:2)
您可以使用pmax
:
transform(df, max_date = pmax(as.Date(date1), as.Date(date2), na.rm = TRUE))
# date1 date2 max_date
# 1 <NA> 2016-12-01 2016-12-01
# 2 2017-01-01 2018-10-01 2018-10-01
# 3 2016-12-01 <NA> 2016-12-01
# 4 <NA> <NA> <NA>