我知道有很多类似的问题,但是无法解决这个问题。
我希望ifelse
函数遍历数据框中的多个列。我想在数据帧中添加两个变量," C03_only"和" only_c02_and_c09"。我只专注于包含值的条目:" C02"," C03"," C09"。
示例数据:
mydf<- data.frame(id=1:4,
x1=c("A02", "C02", "C03", "M01"),
x2=c("B02", "", "C02", "C09"),
x3=c("C03", "C03", "C09", "C02") )
R>mydf
id x1 x2 x3
1 1 A02 B02 C03
2 2 C02 C03
3 3 C03 C02 C09
4 4 M01 C09 C02
新数据集应如下所示:
R>mydf
id x1 x2 x3 C03_only only_c02_and_c09
1 1 A02 B02 C03 1 0
2 2 C02 C03 0 0
3 3 C03 C02 C09 0 0
4 4 M01 C09 C02 0 1
我第一次尝试这样的事情
mydf$C03_only <- with(mydf,ifelse(x1 != "C02" | "C09" & x2 !="C02" | "C09" & x3== "C03",1,0))
哪个没有用,但这个想法很糟糕,因为我有很多专栏,所以没有跑步者。同样地,我厌倦了for loop
:
mydf$C03_only<-rep(0,nrow(mydf))
for (i in 2:nrow(mydf)){
if (mydf$x1[i]!="C02" && mydf$x2[i]!="C09" && mydf$x3[i]=="C03"){
mydf$C03_only[i]<-1}
}
这也没有用,但(只是部分完成)有足够的玩它,它可能会。
我认为最好的方法是使用apply
功能,但无法使其正常工作:
mydf$C03_only<- apply(mydf[,-1], MARGIN=1, FUN=function(x){
ifelse(any(x == "C03") & any(x != "C09" & x != "C02") , 1, 0)
}
)
mydf$only_c02_and_c09<- apply(mydf[,-1], MARGIN=1, FUN=function(x){
ifelse(any(x == "C02" & x == "C09") & any(x != "C03") , 1, 0)
}
)
这些很接近,但没有雪茄。我需要用某些东西替换any
,但不确定是什么。也许将感兴趣的变量传递给向量并使用%in%
运行一些条件语句,但我不确定如何。
任何建议都会很棒,谢谢。
答案 0 :(得分:3)
我们可以按行应用条件。注意:连接到paranthetical括号的加号强制从逻辑到数字。示例:('Coefficients: \n', array([[ -5.04902429e+04, 5.23550164e+04, 2.90631319e+02,
-1.19010351e-01, -1.25257545e+04, 6.52414059e+02]]))
与+(x)
相同:
as.numeric(x)