将因子转换为数字而忽略nas

时间:2017-09-13 16:35:52

标签: r type-conversion numeric na

我有一个数据框,其中包含一些分解的数字列,我需要将它们转换为数字。这是一个示例:

y <- as.data.frame(y)
y <- as.numeric(levels(y))
y$y <- as.numeric(levels(y$y)[y$y])

数据框包含nas,所以当我尝试将因子级别转换为数字时,我得到了所有的回报。这是我试过的。

lodash#forEach

这只返回NA。如何将这些因子水平转换为数字,同时将nas保持为na?

2 个答案:

答案 0 :(得分:1)

您需要删除逗号

as.numeric(gsub(",", "", levels(y$y)[y$y]))

[1] 1200000      NA  150000 1000000  200000 1200000

答案 1 :(得分:0)

您只想保留这些数字,因此您可以使用gsub删除所有其他内容:

levels(y$y) <- gsub("[^0-9]", "", levels(y$y))
levels(y$y) <- as.numeric(levels(y$y))
#         y
# 1 1.2e+08
# 2    <NA>
# 3 1.5e+07
# 4   1e+08
# 5   2e+07
# 6 1.2e+08