如果我有数据框:
a b
2.4 4.6
3.6 66.7
5.8 44.6
a和b都是数字。
我想转换"。"到","与
df$a <- as.numeric(gsub(".", ",", df$a))
但我总是得到
Warning message:NAs introduced by coercion
并且所有值都转换为NA。为什么呢?
答案 0 :(得分:15)
您最初的想法几乎是正确的,只是正则表达式错误,因为.
匹配任何符号。你需要类似的东西(这会将数字向量转换为字符向量)
df$a <- gsub("\\.", ",", df$a)
您还可以更改R打印,绘图和as.character功能的操作输出。您可以使用以下命令将其更改为默认值:
options(OutDec= ",")
另一种选择是使用format
函数。
format(df, decimal.mark=",")
我假设您关心数字的打印方式(输出),因为内部数字存储为双精度浮点数(更新,这要归功于@digemall的评论)。此外,除非像read.table
这样的函数特别指定小数分隔符为,
,否则不可能这样做,因为默认情况下,
用于分隔函数参数。
并且NA
完全是出于这个原因而引入的(除了不正确的正则表达式)。
df$a <- as.numeric(gsub("\\.", ",", df$a))
默认情况下,解析器不知道,
用作小数分隔符。
答案 1 :(得分:2)
如果您只想要逗号进行打印,可以使用格式:
data <- data.frame(a=rnorm(5), b=rnorm(5))
format(data, decimal.mark=",")
a b
1 1,058878354 0,1812629
2 1,026163906 -0,6666500
3 1,538423889 -1,4206752
4 -0,561585916 -0,4729558
5 -0,004685406 1,0744514
然而,这只会改变它们的外观。你仍然需要在分配中使用点。
答案 2 :(得分:2)
您使用的是OSX还是Windows还是......?
要更改表示,您需要查看LC_NUMERIC
参数,尽管R文档警告更改此操作可能会导致R奇怪地运行(当使用它时难以使用,
作为小数定义列表...)
> Sys.getlocale("LC_NUMERIC")
[1] "C"
> a=c(1.01,2.01)
> a
[1] 1.01 2.01
> Sys.setlocale("LC_NUMERIC", "de_DE") # this is OSX syntax
> a
[1] 1,01 2,01
与它一起生活可能更安全!