替换R中的逗号和点

时间:2014-01-09 18:04:06

标签: r vector numeric

我有一整列数字,包括数千和逗号的点分隔符,而不是点作为一个令人沮丧的分隔符。当我尝试从中创建数字列时,我丢失了所有数据。

var1 <- c("50,0", "72,0", "960,0", "1.920,0", "50,0", "50,0", "960,0")
df <- cbind(var1, var2 = as.numeric(gsub(".", "", as.character(var1))))

并结束:

 var1      var2
[1,] "50,0"    NA  
[2,] "72,0"    NA  
[3,] "960,0"   NA  
[4,] "1.920,0" NA  
[5,] "50,0"    NA  
[6,] "50,0"    NA  
[7,] "960,0"   NA 

我做错了什么?

3 个答案:

答案 0 :(得分:36)

您需要转义正则表达式中的".",并且需要先用"."替换逗号,然后才能转换为数字。

> as.numeric(gsub(",", ".", gsub("\\.", "", var1)))
[1]   50   72  960 1920   50   50  960

答案 1 :(得分:5)

对于像这样的事情,我最喜欢scan(),因为它很容易理解。只需使用

scan(text=var1, dec=",", sep=".")
唉,它不会比gsub()快,而另一方面,这种情况过于强大。因此,另一个快速的选项是sub()

as.numeric(sub(",", ".", sub(".", "", var1, fixed=TRUE), fixed=TRUE))

以防万一:当您直接从文件中读取var1时,只需使用指定的分隔符读取它:read.table("file.txt", dec=",", sep=".")

答案 2 :(得分:0)

您可以使用&#34; type_convert&#34;,来自&#34; readr&#34;包。我正在阅读ODS文件(Locale Portuguese),并转换数字:

library('readODS')
library('tidyverse')
data <- read_ods('mod-preditivo.ods', sheet=1,col_names = TRUE,range='a1:b30',col_types=NA)
df <- type_convert(data,trim_ws=TRUE,col_types = cols(Pesos=col_integer(),Alturas=col_double()),locale = locale(decimal_mark = ","))
str(df)