我正在尝试使用scan()读取一个非常大的数据集,该数据集包含从不同行开始的变量。一列包含数字,其中一些仅为20,其他为1,000.00。我读取此数据的代码如下所示:
largedata<-scan(paste0(folder,df.txt),
what=list("","","",0,"","","",""),
skip=20,sep="\t",quote="",dec=".")
但是我的数量庞大,成千上万,不合作。我包括了dec =“。”试图消除这个问题,但我仍然收到这个错误:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got '1,000.00'
如果我只是让我的数字列成为所有其他数据的字符,我的数据集读取正常,但是当我转换为data.frame时,一切都变成了一个因子,当将因子转换为数字时,我的数字值1,000.00及以上均为NA。有没有一种方法可以读取具有这种格式的逗号和小数的数字?除了使用scan()之外,我想不出另一种读取数据的方法。