我正在尝试导入一个固定宽度格式的大型政府文本文件(大约7GB) - 没有指示行的末尾。我有该机构使用的sas输入文件。
以下是我尝试的内容:
read.fwf
- 这会导致R崩溃,大概是因为内存不足(我的电脑有16GB,但我认为你的文件大小需要3倍)。
LaF
- 看起来它可以解决内存问题,但似乎并没有解决线端指标的缺失问题。它最终只能读取第一行数据。
read.SAScii.sqlite
- 这将获取sas文件并使用它来读取R,并使用sqlite来解决内存限制。但是当我运行它时,使用这个指令:
tanf12 <- read.SAScii.sqlite("TANF12A.txt",
"input_TANF12A.sas",
lrecl = 1210)
我收到以下错误消息:
Error in match(x, table, nomatch = 0L) :
argument "tablename" is missing, with no default
Called from: top level
我并不关注这个功能是否足以解决这个问题。