熊猫没有正确读取文件

时间:2018-06-09 07:53:53

标签: python pandas csv fixed-width import-from-csv

我有这里给出的数据文件:: https://www.dropbox.com/sh/8lsvigjjpjhdlap/AAD3VpFdBifGMxrq5C-6yhpPa?dl=0

和以下代码::

import pandas as pd       
df = pd.read_table('Best_2018_Table1.txt', sep=r"\s*")

但是有些事情正在破裂,而且大熊猫没有读到这个格式错误的表格::

df.columns
df['PS1gmag']

读取这种space-for-columns类型的文件的最佳方法是什么?

2 个答案:

答案 0 :(得分:0)

您的正则表达式正在搜索0个或更多空格字符。尝试\ s +以确保至少有1个空格。

答案 1 :(得分:0)

你的文件有固定的宽度字段(标题除外),应该这样读。

使用空格作为分隔符将不起作用,因为某些字段为空并将数据放在错误的列中,例如:

2MASS_J00492677-0635467     M8.5         8.5 null                   M8.5
WISEPC_J004928.48+044100.1  null             L9                19.  L9
WISE_J004945.61+215120.0    null             T8.5              28.5 T8.5
SIPS_J0050-1538             L1:         11.  L0.5              10.5 L1:

会变成:

2MASS_J00492677-0635467     M8.5        8.5   null  M8.5
WISEPC_J004928.48+044100.1  null        L9    19.   L9
WISE_J004945.61+215120.0    null        T8.5  28.5  T8.5
SIPS_J0050-1538             L1:         11.   L0.5  10.5  L1: