R - 基于条件在数据框中创建新列

时间:2017-09-22 16:57:50

标签: r if-statement dataframe

我需要在数据框中创建一个列,其中包含一串yrs,可以自动将每个年份标识为"leap""reg"(常规)。

这就是我到目前为止:

划分时间段

year<-(2009:2017)

在该时间段内创建一个包含单个列的数据框

prd_df<-data.frame(year)

创建一个空列,其中"leap""reg"年将被识别

prd_df["leap"]<-NA

使用条件循环进行基本识别

for(i in 1:length(prd_df$year)){
  if((prd_df$year[i]%%4==0)&(prd_df$year[i]%%100!=0)){
    prd_df$leap<-'leap'
  }else if((prd_df$year[i]%%4==0)&(prd_df$year[i]%%100==0)&(prd_df$year[i]%%400==0)){
    prd_df$leap<-'leap' 
  }else{
    prd_df$leap<-'reg'
  }
}

从结果数据框中创建一个表格。

write.table(prd_df,
          file = "prd.csv",
          row.names = F, col.names = T,
          sep = "\t")

这就是我得到的:

"year"  "leap"
2009    "reg"
2010    "reg"
2011    "reg"
2012    "reg"
2013    "reg"
2014    "reg"
2015    "reg"
2016    "reg"
2017    "reg"

在上面的示例中,2012和2016应该在第二列中标识为"leap",但它不起作用。作为其他代码的一部分,条件在之前工作正常,但我现在无法使其工作。是否可以将prd_df$year识别为数字?

任何建议都将非常受欢迎。

由于

4 个答案:

答案 0 :(得分:2)

我们可以使用ifelse

prd_df$leap <- with(prd_df, ifelse(year %%4== 0 & year %%100 !=0, "leap", "reg"))
prd_df$leap
#[1] "reg"  "reg"  "reg"  "leap" "reg"  "reg"  "reg"  "leap" "reg" 

case_when

中的dplyr
library(dplyr)
prd_df %>%
       mutate(leap = case_when(year %%4 == 0 & year %% 100 !=0 ~ "leap", 
                               TRUE ~"reg"))
#   year leap
#1 2009  reg
#2 2010  reg
#3 2011  reg
#4 2012 leap
#5 2013  reg
#6 2014  reg
#7 2015  reg
#8 2016 leap
#9 2017  reg

答案 1 :(得分:2)

对于您的代码,您在将新值分配到列[i]时错过了leaf

 year<-(2009:2017)
    prd_df<-data.frame(year)
    prd_df["leap"]<-NA

    for(i in 1:length(prd_df$year)){
        if((prd_df$year[i]%%4==0)&(prd_df$year[i]%%100!=0)){
            prd_df$leap[i]<-'leap'#add [i] here
        }
        else if((prd_df$year[i]%%4==0)&(prd_df$year[i]%%100==0)&(prd_df$year[i]%%400==0)){
            prd_df$leap[i]<-'leap' #add [i] here
        }else{
            prd_df$leap[i]<-'reg'#add [i] here
        }
    }


prd_df
  year leap
1 2009  reg
2 2010  reg
3 2011  reg
4 2012 leap
5 2013  reg
6 2014  reg
7 2015  reg
8 2016 leap
9 2017  reg

ifelse多个条件

with(prd_df, ifelse(year %%4== 0 & year %%100 !=0, "leap", ifelse(year %%4== 0 & year %%100 !=0&year%%400==0,"leap","reg")))
[1] "reg"  "reg"  "reg"  "leap" "reg"  "reg"  "reg"  "leap" "reg" 

答案 2 :(得分:1)

尝试搜索lubridate包 - 我认为应该有功能来检查年份是否是飞跃。 对于条件,使用mutp和dplyr包中的case_when。

整个代码不应超过5行:)

答案 3 :(得分:1)

library(dplyr)
library(lubridate)

year_df <- data_frame(year = 1999:2017)

year_df <- year_df %>%
    mutate(leap = ifelse(leap_year(.$year), "leap", "reg"))