在python或pandas中拆分数据文件

时间:2016-07-17 19:48:46

标签: python pandas fixed-width

拥有一个由字符串组成的数据文件(没有选项卡,没有空格,没有列名)。前两列相当于一条数据,第三列是另一列,第4列是其他内容,等等。

如何将这些字符串放入具有命名列的数据框中?我见过的所有答案都假设我有标签,空格等。

1 个答案:

答案 0 :(得分:3)

您可以将pd.read_fwf与widths参数一起使用。包含以下内容的文件:

ieafxfrjzyxfxkymiwuy
lqqmceegjnbjpxnidygr
zssawojanxbrfwkgbvnl
ahcwwhtayjwozzrgfftt

成为这个:

pd.read_fwf('test.txt', widths = [2, 4, 3, 11], names=['first', 'second', 'third', 'fourth'])
Out[226]: 
  first second third       fourth
0    ie   afxf   rjz  yxfxkymiwuy
1    lq   qmce   egj  nbjpxnidygr
2    zs   sawo   jan  xbrfwkgbvnl
3    ah   cwwh   tay  jwozzrgfftt