我想将对数变量设为总资产的变量。我喜欢这样:
`HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))`
,我收到错误消息:In log(HRSdata2$h1atotb) : NaNs produced
我的数据集显示,我获取我预测的log(NA)时会得到NA,但是为什么会得到NaN?他们更关心我。
有人还能告诉我运行循环或其他将日志应用于多列的聪明方法的代码吗?目前,这是我的代码(我知道非常差):
HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))
HRSdata2$h2logass <- (ifelse(HRSdata2$h2atotb > 0, log(HRSdata2$h2atotb), 0))
HRSdata2$h3logass <- (ifelse(HRSdata2$h3atotb > 0, log(HRSdata2$h3atotb), 0))
HRSdata2$h4logass <- (ifelse(HRSdata2$h4atotb > 0, log(HRSdata2$h4atotb), 0))
HRSdata2$h5logass <- (ifelse(HRSdata2$h5atotb > 0, log(HRSdata2$h5atotb), 0))
HRSdata2$h6logass <- (ifelse(HRSdata2$h6atotb > 0, log(HRSdata2$h6atotb), 0))
HRSdata2$h7logass <- (ifelse(HRSdata2$h7atotb > 0, log(HRSdata2$h7atotb), 0))
HRSdata2$h8logass <- (ifelse(HRSdata2$h8atotb > 0, log(HRSdata2$h8atotb), 0))
HRSdata2$h9logass <- (ifelse(HRSdata2$h9atotb > 0, log(HRSdata2$h9atotb), 0))
HRSdata2$h10logass <- (ifelse(HRSdata2$h10atotb > 0, log(HRSdata2$h10atotb), 0))
我基本上只需要学习如何遍历变量名就可以了。
答案 0 :(得分:3)
当您执行ifelse(x > 0, log(x), 0)
时,R会计算log(x)
:
> x <- c(2, -1, 3)
> ifelse(x > 0, log(x), 0)
[1] 0.6931472 0.0000000 1.0986123
Warning message:
In log(x) : NaNs produced
但是结果是您没有得到NaN
,对于与0
相对应的值,您得到了x <= 0
。
此ifelse
语句等效于
ifelse(c(TRUE, FALSE, TRUE), c(log(2), log(-1), log(3)), c(0,0,0))
R不会删除对第一个参数的值为FALSE
的第二个参数的值的计算。
答案 1 :(得分:0)
我个人对ifelse
不满意,倾向于改用两行代码来代替默认值,然后有条件地应用替代方法。
要遍历所有列,您可以使用以下代码(由于没有数据,因此我没有进行测试)
for(i in 1:10){
HRSdata2[,paste0('h',i,'logass')] <- 0
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)
HRSdata2[w,paste0('h',i,'logass')] <- HRSdata2[w,paste0('h',i,'atotb')]
}
此代码将为NA值输出零,如果不需要,则应替换:
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)
具有:
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0 | is.na( HRSdata2[,paste0('h',i,'atotb')] ) )