我在数据帧v1
中有一个向量df
。用summary(v1)
查看数据将显示以下内容:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 7 16 15649 26 100000000
我正在尝试清理数据,并发现sum(df$v1==0)/nrow(df)
中大约2%的值为0。但是,当我尝试使用同一事物获取最大值时,却没有任何结果:
sum(df$v1==100000000)/nrow(df)
[1] 0
我知道情况并非如此,因为至少有10个值是每10,000,000个
tail(sort(df$v1),10)
[1] 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08 1e+08
任何想法都在发生什么,如何查看极值的数量? R是否以我不知道的方式存储这些值(数据可能来自除以零的公式)?