我尝试使用以下脚本将NaN
值替换为零:
rapply( data123, f=function(x) ifelse(is.nan(x),0,x), how="replace" )
# [31] 0.00000000 -0.67994832 0.50287454 0.63979527 1.48410571 -2.90402836
NaN值显示为零但是当我输入数据框的名称并尝试查看时,该值仍然是NaN。
data123$contri_us
# [31] NaN -0.67994832 0.50287454 0.63979527 1.48410571 -2.90402836
我不确定rapply
命令是否实际在数据框中应用了调整,或者只是按照显示替换了值。
知道如何将NaN
值实际更改为零吗?
答案 0 :(得分:71)
is.nan
似乎is.na
实际上没有数据框的方法,与is.nan.data.frame <- function(x)
do.call(cbind, lapply(x, is.nan))
data123[is.nan(data123)] <- 0
不同。所以,让我们解决这个问题!
{{1}}
答案 1 :(得分:26)
事实上,在R中,这个操作非常简单:
如果矩阵'a'包含一些NaN,您只需使用以下代码将其替换为0:
a <- matrix(c(1, NaN, 2, NaN), ncol=2, nrow=2)
a[is.nan(a)] <- 0
a
如果数据框'b'包含一些NaN,您只需使用以下代码将其替换为0:
#for a data.frame:
b <- data.frame(c1=c(1, NaN, 2), c2=c(NaN, 2, 7))
b[is.na(b)] <- 0
b
当数据框是数据框时,请注意差异is.nan
,而不是is.na
。
做
#...
b[is.nan(b)] <- 0
#...
产生:Error in is.nan(b) : default method not implemented for type 'list'
因为b是数据框。
注意:编辑小但混乱的拼写错误
答案 2 :(得分:17)
以下应该做你想做的事:
x <- data.frame(X1=sample(c(1:3,NaN), 200, replace=TRUE), X2=sample(c(4:6,NaN), 200, replace=TRUE))
head(x)
x <- replace(x, is.na(x), 0)
head(x)
答案 3 :(得分:8)
这是一个 tidyverse
解决方案。我已经用 NaN
和 NA
生成了示例数据。第一列已完全完成。
df <- tibble(x = LETTERS[1:5],
y = c(1:3, NaN, 4),
z = c(rep(NaN, 3), NA, 5))
> df
# A tibble: 5 x 3
x y z
<chr> <dbl> <dbl>
1 A 1 NaN
2 B 2 NaN
3 C 3 NaN
4 D NaN NA
5 E 4 5
然后我们可以将 mutate_all
和 replace
应用于数据帧:
> df %>%
+ mutate_all(~replace(., is.nan(.), 0))
# A tibble: 5 x 3
x y z
<chr> <dbl> <dbl>
1 A 1 0
2 B 2 0
3 C 3 0
4 D 0 NA
5 E 4 5
我们已将 NaN
值替换为零,并且既未触及 NA
值也未触及 x
列。