Question

2000       1    -999
2000       2    -999
2000       3    -999
2000       4    -999
2000       5    -999
2000       6    -999
2000       7    -999
2000       8    -999
2000       9    -999
2000      10    -999
2000      11    -999
2000      12    -999
2000      13    -999
2000      14    -999
2000      15    -999
2000      16    -999
2000      17    -999

我想将包含以上数据的文本文件读入pandas数据框中，我正在使用此命令，但输出不是我想要的：

df = pd.read_csv(path_file, names=['col_a', 'col_b', 'col_c'])

如何修复此输出：

                      col_a  col_b  col_c
0      2000       1    -999    NaN    NaN
1      2000       2    -999    NaN    NaN
2      2000       3    -999    NaN    NaN
3      2000       4    -999    NaN    NaN
4      2000       5    -999    NaN    NaN

Answer 1

要做：

df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'],sep='\s+')

添加一个额外的sep='\s+'，因为默认情况下它是用逗号而不是空格分隔的，所以请更改它。

或delim_whitespace：

df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'], delim_whitespace=True)

在熊猫中读取文本文件时列不正确

1 个答案: