如何根据R中另一列中的值设置列值

时间:2013-08-15 16:08:47

标签: r

我正在尝试根据另一列中的值添加新列。 (基本上如果缺少另一列或0,则将新值设置为0或1)

以下代码有什么问题?

times=nrow(eachfile)
for(i in 1:times)
{eachfile$SalesCycleN0[i] <- ifelse(eachfile$R[i]==NA | eachfile$R[i]==0,0,1 ) }

table(eachfile$SalesCycleN0)

3 个答案:

答案 0 :(得分:4)

只要您测试过该列只包含0,1和NA,我就会这样做:

eachfile$SalesCycleN0 <- 1
eachfile$SalesCycleN0[is.na(eachfile$R) | eachfile$R==0] <- 0

答案 1 :(得分:2)

NA没有“==”。就这样做(没有循环):

eachfile$SalesCycleN0 <- ifelse( is.na(eachfile$R) | eachfile$R==0, 0,1 ) 

如果您在代码中寻求更多经济性,这也可能有效:

eachfile$SalesCycleN0 <- as.numeric( !grepl("^0$", eachfile$R) )
对于NA,

grepl返回FALSE。

答案 2 :(得分:2)

更有效的方法是使用sapply函数,而不是使用for循环(在大型数据集的情况下很方便)。这是一个例子:

 df = data.frame(x = c(1,2,0,NA,5))

 fun = function(i) {is.na(df$x[i]) || (df$x[i] == 0)}
 bin <- (sapply(1:nrow(df), FUN = fun))*1  ## multiplying by 1 will convert the logical vector to a binary one.
 df <- cbind(df, bin)

在你的情况下:

 fun = function(i) {is.na(eachfile$SalesCycleNO[i]) || (eachfile$SalesCycleNO[i] == 0)}
 bin <- (sapply(1:times, FUN = fun))*1
 eachfile <- cbind(eachfile, bin)