我想阅读一个由“|”分隔的大文本文件。所以我使用了下面的代码。
sampleData <- read.table(file = '2013_4MM01_7-11_CD.txt',header =TRUE, sep = '|', nrows=10)
pos<- read.table.ffdf(file="2013_4MM01_7-11_CD.txt", header=TRUE, VERBOSE=TRUE,
FUN='read.table', sep = '|',
first.rows=10000, next.rows=50000, colClasses=classes)
我使用了“ff”包并在运行代码结束后检查了我的数据。我的数据有一些长数字变量,如“201304012371090245546”,从数据中读取的对象是错误的。我的ffdf对象包含许多重复的行,甚至包含原始txt文件中没有的数字。我通过SAS检查了这个。请给我一些有用的建议。