我是编程新手,并不太了解R中函数背后的逻辑。我想创建一个能够处理四个变量的函数,其中三个条件决定第四个变量的结果;这遍及数据集中的所有情况。为简单起见,假设我的数据框有四个变量(var1到var4),每个变量有100个案例:
f1 <- function(w, x, y, z) {
for (n in seq_along(w)) {
if (!is.na(w[n]) & !is.na(x[n]) & !is.na(y[n])){
z[n]<-0
}else if (!is.na(w[n]) & !is.na(x[n]) & is.na(y[n])){
z[n]<-1
}else if (!is.na(w[n]) & is.na(x[n]) & is.na(y[n])){
z[n]<-2
}else if (!is.na(w[n]) & is.na(x[n]) & !is.na(y[n])){
z[n]<-3
} } }
f1(df$var1, df$var2, df$var3, df$var4)
为什么功能不起作用?
答案 0 :(得分:1)
您在z
内修改的变量f1
是本地副本,并且未在原始数据集df
中更新。您需要返回修改后的z
并将其分配到var4
中的df
。
f1 <- function(w, x, y, z) {
for (n in seq_along(w)) {
if (!is.na(w[n]) & !is.na(x[n]) & !is.na(y[n])){
z[n]<-0
} else if (!is.na(w[n]) & !is.na(x[n]) & is.na(y[n])) {
z[n]<-1
} else if (!is.na(w[n]) & is.na(x[n]) & is.na(y[n])) {
z[n]<-2
} else if (!is.na(w[n]) & is.na(x[n]) & !is.na(y[n])) {
z[n]<-3
}
}
z # <--- return value
}
然后将f1
称为:
df$var4 <- f1(df$var1, df$var2, df$var3, df$var4)