我正在处理从IPUMS.ORG收到的普查数据。文件格式为“ .dat”。 以下代码是如何打开dat文件的。但是所有数据都合并到一个列中。我不确定这是否是处理它的最佳方法。
df = pd.read_csv('ipumsi_00002.dat')
>>df
1 250196825019680100000000100000002000000100002000
2 2501968250196801000000003000000020000002000020...
... #and thousand of more rows
我想知道是否有一种方法可以将每一行分成不同长度的数字。如
id year country schooling educ ...
1 250 1968 25019680 100000 00010000 ...