我希望并且担心这只有一个答案,而且我不好意思不得不问:
由于使用reshape2转换数据帧,我有一个大型数据帧,其第一行如下:
ukgridcode x y year pm10 pm2.5 no2 nox co so2 ozone benzene
1 56361 460500 1218500 2001 8.583796 NaN 2.375508 3.031918 NaN NaN NaN NaN
2 57051 460500 1217500 2001 8.584764 NaN 2.368387 3.022830 NaN NaN NaN NaN
3 57052 461500 1217500 2001 8.587392 NaN 2.383438 3.042039 NaN NaN NaN NaN
4 57054 463500 1217500 2001 8.590163 NaN 2.455386 3.133869 NaN NaN NaN NaN
5 57741 460500 1216500 2001 8.588822 NaN 2.375839 3.032340 NaN NaN NaN NaN
6 57742 461500 1216500 2001 8.592360 NaN 2.394949 3.056732 NaN NaN NaN NaN
我想把每个NaN变成NA。到目前为止,我已经尝试过:
d2 <- d[is.nan(d)] <- NA
d2 <- d[!is.finite(d)] <- NA
d2 <- apply(d, 2, function (x) x[is.nan(x)] <- NA) # also tried row-wise (1)
但到目前为止还没有成功。
非常感谢解决方案。
答案 0 :(得分:4)
尝试
d[sapply(d, is.nan)] <- NA
# ukgridcode x y year pm10 pm2.5 no2 nox co so2 ozone benzene
# 1 56361 460500 1218500 2001 8.583796 NA 2.375508 3.031918 NA NA NA NA
# 2 57051 460500 1217500 2001 8.584764 NA 2.368387 3.022830 NA NA NA NA
# 3 57052 461500 1217500 2001 8.587392 NA 2.383438 3.042039 NA NA NA NA
# 4 57054 463500 1217500 2001 8.590163 NA 2.455386 3.133869 NA NA NA NA
# 5 57741 460500 1216500 2001 8.588822 NA 2.375839 3.032340 NA NA NA NA
# 6 57742 461500 1216500 2001 8.592360 NA 2.394949 3.056732 NA NA NA NA
或使用data.table
library(data.table)
setDT(d)[, lapply(.SD, function(x) ifelse(is.nan(x), NA, x))]
或者只看@Rolands评论
答案 1 :(得分:0)
您可以尝试:
is.nan(d$pm2.5)
#[1] TRUE TRUE TRUE TRUE TRUE TRUE
d[d=="NaN"] <- NA
d
# ukgridcode x y year pm10 pm2.5 no2 nox co so2 ozone
#1 56361 460500 1218500 2001 8.583796 NA 2.375508 3.031918 NA NA NA
#2 57051 460500 1217500 2001 8.584764 NA 2.368387 3.022830 NA NA NA
#3 57052 461500 1217500 2001 8.587392 NA 2.383438 3.042039 NA NA NA
#4 57054 463500 1217500 2001 8.590163 NA 2.455386 3.133869 NA NA NA
#5 57741 460500 1216500 2001 8.588822 NA 2.375839 3.032340 NA NA NA
#6 57742 461500 1216500 2001 8.592360 NA 2.394949 3.056732 NA NA NA
# benzene
#1 NA
#2 NA
#3 NA
#4 NA
#5 NA
#6 NA
答案 2 :(得分:0)
如果数据框可作为csv文件提供,则正则表达式会发现用NA替换NaN可以在带有正则表达式的文本编辑器中工作(例如在notepad ++中)
答案 3 :(得分:0)
d[is.na(d)]<-NA
问题是 is.nan
没有实现数据框的方法,但 is.na
有 (is.na.data.frame
)。由于 is.na(NaN)
返回 TRUE,因此上述方法有效。