如何将数据帧中的NaN转换为NA

时间:2014-07-29 10:44:58

标签: r dataframe apply nan na

我希望并且担心这只有一个答案,而且我不好意思不得不问:

由于使用reshape2转换数据帧,我有一个大型数据帧,其第一行如下:

  ukgridcode      x       y year     pm10 pm2.5      no2      nox  co so2 ozone benzene
1      56361 460500 1218500 2001 8.583796   NaN 2.375508 3.031918 NaN NaN   NaN     NaN
2      57051 460500 1217500 2001 8.584764   NaN 2.368387 3.022830 NaN NaN   NaN     NaN
3      57052 461500 1217500 2001 8.587392   NaN 2.383438 3.042039 NaN NaN   NaN     NaN
4      57054 463500 1217500 2001 8.590163   NaN 2.455386 3.133869 NaN NaN   NaN     NaN
5      57741 460500 1216500 2001 8.588822   NaN 2.375839 3.032340 NaN NaN   NaN     NaN
6      57742 461500 1216500 2001 8.592360   NaN 2.394949 3.056732 NaN NaN   NaN     NaN

我想把每个NaN变成NA。到目前为止,我已经尝试过:

d2 <- d[is.nan(d)] <- NA
d2 <- d[!is.finite(d)] <- NA
d2 <- apply(d, 2, function (x) x[is.nan(x)] <- NA) # also tried row-wise (1)

但到目前为止还没有成功。

非常感谢解决方案。

4 个答案:

答案 0 :(得分:4)

尝试

d[sapply(d, is.nan)] <- NA


#   ukgridcode      x       y year     pm10 pm2.5      no2      nox co so2 ozone benzene
# 1      56361 460500 1218500 2001 8.583796    NA 2.375508 3.031918 NA  NA    NA      NA
# 2      57051 460500 1217500 2001 8.584764    NA 2.368387 3.022830 NA  NA    NA      NA
# 3      57052 461500 1217500 2001 8.587392    NA 2.383438 3.042039 NA  NA    NA      NA
# 4      57054 463500 1217500 2001 8.590163    NA 2.455386 3.133869 NA  NA    NA      NA
# 5      57741 460500 1216500 2001 8.588822    NA 2.375839 3.032340 NA  NA    NA      NA
# 6      57742 461500 1216500 2001 8.592360    NA 2.394949 3.056732 NA  NA    NA      NA

或使用data.table

library(data.table)
setDT(d)[, lapply(.SD, function(x) ifelse(is.nan(x), NA, x))]

或者只看@Rolands评论

答案 1 :(得分:0)

您可以尝试:

 is.nan(d$pm2.5)
 #[1] TRUE TRUE TRUE TRUE TRUE TRUE

 d[d=="NaN"] <- NA
 d
 #    ukgridcode      x       y year     pm10 pm2.5      no2      nox co so2 ozone
 #1      56361 460500 1218500 2001 8.583796    NA 2.375508 3.031918 NA  NA    NA
 #2      57051 460500 1217500 2001 8.584764    NA 2.368387 3.022830 NA  NA    NA
 #3      57052 461500 1217500 2001 8.587392    NA 2.383438 3.042039 NA  NA    NA
 #4      57054 463500 1217500 2001 8.590163    NA 2.455386 3.133869 NA  NA    NA
 #5      57741 460500 1216500 2001 8.588822    NA 2.375839 3.032340 NA  NA    NA
 #6      57742 461500 1216500 2001 8.592360    NA 2.394949 3.056732 NA  NA    NA
 #  benzene
 #1      NA
 #2      NA
 #3      NA
 #4      NA
 #5      NA
 #6      NA

答案 2 :(得分:0)

如果数据框可作为csv文件提供,则正则表达式会发现用NA替换NaN可以在带有正则表达式的文本编辑器中工作(例如在notepad ++中)

答案 3 :(得分:0)

d[is.na(d)]<-NA

问题是 is.nan 没有实现数据框的方法,但 is.na 有 (is.na.data.frame)。由于 is.na(NaN) 返回 TRUE,因此上述方法有效。