如何正确读取大熊猫中的文本文件?

时间:2018-08-03 18:10:27

标签: python pandas

我正在尝试阅读file.txt,如下所示:

%b jjj 123

%%% 4 5 6

%%%
s 1 2 s
t 3 2 f
p 2 2 f

i 0 9 e
%%%
u 3 3 e

我正在使用pandas,所以我做了

>> pd.read_table('file.txt',comment="%", header="None", names=["c1","c2","c3","c4"])
        c1  c2  c3  c4
0  s 1 2 s NaN NaN NaN
1  t 3 2 f NaN NaN NaN
2  p 2 2 f NaN NaN NaN
3  i 0 9 e NaN NaN NaN
4  u 3 3 e NaN NaN NaN

这显然是错误的。这就是我想要得到的

   c1  c2  c3  c4
0  s   1    2   s
1  t   3    2   f
2  p   2    2   f
3  i   0    9   e
4  u   3    3   e

1 个答案:

答案 0 :(得分:1)

您快到了,只需添加sep=' '即可确保它读取空格作为分隔符:

df = pd.read_table('file.txt', sep = ' ', comment="%", header=None, names=["c1","c2","c3","c4"])

>>> df
  c1  c2  c3 c4
0  s   1   2  s
1  t   3   2  f
2  p   2   2  f
3  i   0   9  e
4  u   3   3  e