我正在将出生证明信息的大型数据集从原始DAT文件转换为Stata DTA。我有一本由国家经济研究局编写的数据字典,我已成功输入其他年份的类似文件。
但是,当我在这个特定文件上运行输入程序时,我收到错误
记录太久了
输出数据集缺少~14%的记录。磁盘上有足够的空间用于输出。这个看似矛盾的错误意味着什么呢?
答案 0 :(得分:0)
我决定发布并回答它,仅仅是因为我能够找到关于此Stata错误的小型在线文档。
在我的情况下,它实际上是一个简单的解决方案。原始数据源自zip文件。当我再次归档原始数据时,我发现原始文件比我使用的原始文件大约1GB - 缺少14%。无论解压缩错误导致截断也可能截断中间记录,因此当我运行输入程序时,Stata产生了“记录太长”的错误。