在熊猫中读取文本文件时列不正确

时间:2018-10-29 03:48:32

标签: python pandas

2000       1    -999
2000       2    -999
2000       3    -999
2000       4    -999
2000       5    -999
2000       6    -999
2000       7    -999
2000       8    -999
2000       9    -999
2000      10    -999
2000      11    -999
2000      12    -999
2000      13    -999
2000      14    -999
2000      15    -999
2000      16    -999
2000      17    -999

我想将包含以上数据的文本文件读入pandas数据框中,我正在使用此命令,但输出不是我想要的:

df = pd.read_csv(path_file, names=['col_a', 'col_b', 'col_c'])

如何修复此输出:

                      col_a  col_b  col_c
0      2000       1    -999    NaN    NaN
1      2000       2    -999    NaN    NaN
2      2000       3    -999    NaN    NaN
3      2000       4    -999    NaN    NaN
4      2000       5    -999    NaN    NaN

1 个答案:

答案 0 :(得分:3)

要做:

df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'],sep='\s+')

添加一个额外的sep='\s+',因为默认情况下它是用逗号而不是空格分隔的,所以请更改它。

delim_whitespace

df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'], delim_whitespace=True)