预计真正得到“1,000.00”

时间:2015-12-08 01:46:07

标签: r

我正在尝试使用scan()读取一个非常大的数据集,该数据集包含从不同行开始的变量。一列包含数字,其中一些仅为20,其他为1,000.00。我读取此数据的代码如下所示:

largedata<-scan(paste0(folder,df.txt),
            what=list("","","",0,"","","",""),
            skip=20,sep="\t",quote="",dec=".")

但是我的数量庞大,成千上万,不合作。我包括了dec =“。”试图消除这个问题,但我仍然收到这个错误:

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
  scan() expected 'a real', got '1,000.00'

如果我只是让我的数字列成为所有其他数据的字符,我的数据集读取正常,但是当我转换为data.frame时,一切都变成了一个因子,当将因子转换为数字时,我的数字值1,000.00及以上均为NA。有没有一种方法可以读取具有这种格式的逗号和小数的数字?除了使用scan()之外,我想不出另一种读取数据的方法。

0 个答案:

没有答案