我正在尝试根据另一列中的值添加新列。 (基本上如果缺少另一列或0,则将新值设置为0或1)
以下代码有什么问题?
times=nrow(eachfile)
for(i in 1:times)
{eachfile$SalesCycleN0[i] <- ifelse(eachfile$R[i]==NA | eachfile$R[i]==0,0,1 ) }
table(eachfile$SalesCycleN0)
答案 0 :(得分:4)
只要您测试过该列只包含0,1和NA,我就会这样做:
eachfile$SalesCycleN0 <- 1
eachfile$SalesCycleN0[is.na(eachfile$R) | eachfile$R==0] <- 0
答案 1 :(得分:2)
NA没有“==”。就这样做(没有循环):
eachfile$SalesCycleN0 <- ifelse( is.na(eachfile$R) | eachfile$R==0, 0,1 )
如果您在代码中寻求更多经济性,这也可能有效:
eachfile$SalesCycleN0 <- as.numeric( !grepl("^0$", eachfile$R) )
对于NA, grepl
返回FALSE。
答案 2 :(得分:2)
更有效的方法是使用sapply
函数,而不是使用for
循环(在大型数据集的情况下很方便)。这是一个例子:
df = data.frame(x = c(1,2,0,NA,5))
fun = function(i) {is.na(df$x[i]) || (df$x[i] == 0)}
bin <- (sapply(1:nrow(df), FUN = fun))*1 ## multiplying by 1 will convert the logical vector to a binary one.
df <- cbind(df, bin)
在你的情况下:
fun = function(i) {is.na(eachfile$SalesCycleNO[i]) || (eachfile$SalesCycleNO[i] == 0)}
bin <- (sapply(1:times, FUN = fun))*1
eachfile <- cbind(eachfile, bin)