应用错误收集

我正在处理从IPUMS.ORG收到的普查数据。文件格式为“ .dat”。以下代码是如何打开dat文件的。但是所有数据都合并到一个列中。我不确定这是否是处理它的最佳方法。

 df = pd.read_csv('ipumsi_00002.dat')
>>df
 1    250196825019680100000000100000002000000100002000    
 2    2501968250196801000000003000000020000002000020...  
 ... #and thousand of more rows

我想知道是否有一种方法可以将每一行分成不同长度的数字。如

     id  year  country  schooling  educ     ...  
 1   250 1968  25019680  100000    00010000 ...

处理.dat文件并将其格式化为Python的正确方法是什么？

0 个答案: