拥有一个由字符串组成的数据文件(没有选项卡,没有空格,没有列名)。前两列相当于一条数据,第三列是另一列,第4列是其他内容,等等。
如何将这些字符串放入具有命名列的数据框中?我见过的所有答案都假设我有标签,空格等。
答案 0 :(得分:3)
您可以将pd.read_fwf与widths参数一起使用。包含以下内容的文件:
ieafxfrjzyxfxkymiwuy
lqqmceegjnbjpxnidygr
zssawojanxbrfwkgbvnl
ahcwwhtayjwozzrgfftt
成为这个:
pd.read_fwf('test.txt', widths = [2, 4, 3, 11], names=['first', 'second', 'third', 'fourth'])
Out[226]:
first second third fourth
0 ie afxf rjz yxfxkymiwuy
1 lq qmce egj nbjpxnidygr
2 zs sawo jan xbrfwkgbvnl
3 ah cwwh tay jwozzrgfftt