在引号之间导入csv列为整数

时间:2015-05-21 19:29:28

标签: r csv import

我(非常)是R的新手,我试图自己学习,但我无法找到答案,或者至少不是最佳答案!

我有一个包含这样的行的CSV: " 123112300500"" A"" 395"

如您所见,第一列和最后一列是整数,但它们在引号内。我不想预处理我的输入(因为我认为R可以处理这个),我试图像这样导入csv:

set< - read.csv(" set.csv",header = TRUE,sep =",",colClasses = c(" integer" ,"字符","整数")

但它不会起作用,因为它不会引用引号!

我的解决方案目前正在做 设置$ V1< - as.integer(设置$ V1) 但它引入了很多开销(我喜欢2百万行,不同的列有整数或数值)。

如何使用read.csv在标记之间导入带整数(或浮点数或其他所有内容)的值?

提前感谢任何人:)

1 个答案:

答案 0 :(得分:2)

您确定该列中的所有值都是数字吗? type.convert似乎处理引用的数字就好......

a <- '"a", "b", "1", "2"
      "c", "d", "3", "4"'
df <- read.csv(text=a, stringsAsFactors=F, header=F)
> str(df)
'data.frame':   2 obs. of  4 variables:
 $ V1: chr  "a" "      c"
 $ V2: chr  " b" " d"
 $ V3: int  1 3
 $ V4: int  2 4