我有一个带\ t分隔符(或空格)的文本文件。但是有些条目是空的,例如,
col1 col2
A1 A2
B2
我如何以这样的方式阅读这篇文章,它在空条目中给了我Nan。 现在,当我读到它时,我会得到类似的东西
col1 col2
A1 A2
B2 Nan
答案 0 :(得分:0)
您可以使用reindex()方法进行修复。
答案 1 :(得分:0)
您可以在阅读csv时指定分隔符:
In [11]: from StringIO import StringIO
In [12]: pd.read_csv(StringIO('col1\tcol2\nA1\tA2\n\tB2'), sep='\t')
Out[12]:
col1 col2
0 A1 A2
1 NaN B2
如果它的固定宽度而不是分隔的另一个选项是pd.read_fwf
。
In [21]: pd.read_fwf(StringIO('col1 col2\nA1 A2\n B2\n'))
Out[21]:
col1 col2
0 A1 A2
1 NaN B2