我有一个txt文件:
24688 1965 12 31 12 0 0 0.0 -48.3
24688 1965 12 31 15 0 0 -47.2
24688 1965 12 31 18 0 0 -49.0
24688 1965 12 31 21 0 0 0.0 -48.1
24688 1966 1 1 0 0 0 0.0 -52.5
..........
我正在尝试使用此DataFrame
data = pd.read_csv('/home/igor/py/normdata.txt', header=None, sep='\s+')
24688 1965 12 31 12 0 0 0.0 -48.3
24688 1965 12 31 15 0 0 Nan -47.2
24688 1965 12 31 18 0 0 Nan -49.0
24688 1965 12 31 21 0 0 0.0 -48.1
24688 1966 1 1 0 0 0 0.0 -52.5
但是我得到了
24688 1965 12 31 12 0.0 0.0 0.0 -48.3
24688 1965 12 31 15 0.0 0.0 -47.2 Nan
24688 1965 12 31 18 0.0 0.0 -49.0 Nan
24688 1965 12 31 21 0.0 0.0 0.0 -48.1
24688 1966 1 1 0 0.0 0.0 0.0 -52.5
有人可以帮助我吗?
答案 0 :(得分:4)
您应该告诉Pandas,分隔符最多包含四个空格:
pd.read_csv('/home/igor/py/normdata.txt', sep="\s{1,4}",
header=None)
您还可以考虑使用pandas.read_fwf()
,因为您的表格具有固定宽度的格式。