如何使用Nan读取熊猫中的CSV文件?

时间:2019-12-23 00:49:43

标签: python pandas csv

我有一个txt文件:

24688 1965 12 31 12   0  0    0.0 -48.3
24688 1965 12 31 15   0  0        -47.2
24688 1965 12 31 18   0  0        -49.0
24688 1965 12 31 21   0  0    0.0 -48.1
24688 1966  1  1  0   0  0    0.0 -52.5

..........

我正在尝试使用此DataFrame data = pd.read_csv('/home/igor/py/normdata.txt', header=None, sep='\s+')

24688 1965 12 31 12   0  0    0.0 -48.3
24688 1965 12 31 15   0  0    Nan -47.2
24688 1965 12 31 18   0  0    Nan -49.0
24688 1965 12 31 21   0  0    0.0 -48.1
24688 1966  1  1  0   0  0    0.0 -52.5

但是我得到了

24688   1965    12  31  12  0.0 0.0 0.0 -48.3
24688   1965    12  31  15  0.0 0.0 -47.2 Nan
24688   1965    12  31  18  0.0 0.0 -49.0 Nan
24688   1965    12  31  21  0.0 0.0 0.0 -48.1
24688   1966    1   1   0   0.0 0.0 0.0 -52.5

有人可以帮助我吗?

1 个答案:

答案 0 :(得分:4)

您应该告诉Pandas,分隔符最多包含四个空格:

pd.read_csv('/home/igor/py/normdata.txt', sep="\s{1,4}", 
            header=None)

您还可以考虑使用pandas.read_fwf(),因为您的表格具有固定宽度的格式。