2000 1 -999
2000 2 -999
2000 3 -999
2000 4 -999
2000 5 -999
2000 6 -999
2000 7 -999
2000 8 -999
2000 9 -999
2000 10 -999
2000 11 -999
2000 12 -999
2000 13 -999
2000 14 -999
2000 15 -999
2000 16 -999
2000 17 -999
我想将包含以上数据的文本文件读入pandas数据框中,我正在使用此命令,但输出不是我想要的:
df = pd.read_csv(path_file, names=['col_a', 'col_b', 'col_c'])
如何修复此输出:
col_a col_b col_c
0 2000 1 -999 NaN NaN
1 2000 2 -999 NaN NaN
2 2000 3 -999 NaN NaN
3 2000 4 -999 NaN NaN
4 2000 5 -999 NaN NaN
答案 0 :(得分:3)
要做:
df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'],sep='\s+')
添加一个额外的sep='\s+'
,因为默认情况下它是用逗号而不是空格分隔的,所以请更改它。
或delim_whitespace
:
df = pd.read_csv(filename, names=['col_a', 'col_b', 'col_c'], delim_whitespace=True)