如何在庞大的数据框架中将NaN值替换为零?

时间:2013-08-09 07:39:33

标签: r replace

我尝试使用以下脚本将NaN值替换为零:

rapply( data123, f=function(x) ifelse(is.nan(x),0,x), how="replace" )
# [31]   0.00000000  -0.67994832   0.50287454   0.63979527   1.48410571  -2.90402836

NaN值显示为零但是当我输入数据框的名称并尝试查看时,该值仍然是NaN。

data123$contri_us
# [31]          NaN  -0.67994832   0.50287454   0.63979527   1.48410571  -2.90402836

我不确定rapply命令是否实际在数据框中应用了调整,或者只是按照显示替换了值。

知道如何将NaN值实际更改为零吗?

4 个答案:

答案 0 :(得分:71)

is.nan似乎is.na实际上没有数据框的方法,与is.nan.data.frame <- function(x) do.call(cbind, lapply(x, is.nan)) data123[is.nan(data123)] <- 0 不同。所以,让我们解决这个问题!

{{1}}

答案 1 :(得分:26)

事实上,在R中,这个操作非常简单:

如果矩阵'a'包含一些NaN,您只需使用以下代码将其替换为0:

a <- matrix(c(1, NaN, 2, NaN), ncol=2, nrow=2)
a[is.nan(a)] <- 0
a

如果数据框'b'包含一些NaN,您只需使用以下代码将其替换为0:

#for a data.frame: 
b <- data.frame(c1=c(1, NaN, 2), c2=c(NaN, 2, 7))
b[is.na(b)] <- 0
b

当数据框是数据框时,请注意差异is.nan,而不是is.na

#...
b[is.nan(b)] <- 0
#...

产生:Error in is.nan(b) : default method not implemented for type 'list'因为b是数据框。

注意:编辑小但混乱的拼写错误

答案 2 :(得分:17)

以下应该做你想做的事:

x <- data.frame(X1=sample(c(1:3,NaN), 200, replace=TRUE), X2=sample(c(4:6,NaN), 200, replace=TRUE))
head(x)
x <- replace(x, is.na(x), 0)
head(x)

答案 3 :(得分:8)

这是一个 tidyverse 解决方案。我已经用 NaNNA 生成了示例数据。第一列已完全完成。

df <- tibble(x = LETTERS[1:5],
             y = c(1:3, NaN, 4),
             z = c(rep(NaN, 3), NA, 5))

> df
# A tibble: 5 x 3
  x         y     z
  <chr> <dbl> <dbl>
1 A         1   NaN
2 B         2   NaN
3 C         3   NaN
4 D       NaN    NA
5 E         4     5

然后我们可以将 mutate_allreplace 应用于数据帧:

> df %>% 
+   mutate_all(~replace(., is.nan(.), 0))
# A tibble: 5 x 3
  x         y     z
  <chr> <dbl> <dbl>
1 A         1     0
2 B         2     0
3 C         3     0
4 D         0    NA 
5 E         4     5

我们已将 NaN 值替换为零,并且既未触及 NA 值也未触及 x 列。