有关在r数据框中创建新变量的最佳逻辑的建议是否依赖于数据框中的其他变量?
基本上,我在一个数据框中有一个类型变量,我想要覆盖在第二个数据帧中的certian实例中。以下是一些示例数据:
#### original data frame
id=c(1,2,3,4,5,6)
type=c("O", "O", "G", "O", "G", "O")
qty=c(10,20,30,40,50,60)
df1=data.frame(id, type, qty)
#### new dataframe with type override
id=c(2,4)
type_override=c("G", "G")
df2=data.frame(id,type_override)
#### dataframe with both origional and override type
df3=merge(df1, df2, by=c("id"), all.x=TRUE)
#### create new type variable that uses "type" for all variables
#### unless "type_override" calls for a override
df3$type_new= ???????
我想在第二个数据帧中使用类型分类(即“type_override”)来覆盖类型分类(即第一个数据帧中的“type”。
我是一个试图过渡到R的Excel用户,在Exel中,我会做类似的事情:
type_newC1 = if(isna(type_overrideB1),typeA1,type_overrideB1)
非常感谢任何协助。
答案 0 :(得分:1)
代码几乎与您在Excel中使用的代码相同:
df3$type_new <- ifelse(is.na(df3$type_override),df3$type,df3$type_override)
或者如果您想保存一些打字,R用户通常会使用with
:
df3$type_new <- with(df3,ifelse(is.na(type_override),type,type_override))
答案 1 :(得分:0)
如果你的df2只与一种类型一起使用,你可以一步到位:
df1$type_override <- ifelse(df1$id %in% df2$id, df2$type_override, df1$type)