如何从没有空列的.dat文件中获取数据

时间:2014-10-22 15:01:43

标签: python csv pandas

我是熊猫和蟒蛇的新手。我有一个我不明白的问题,我有一组.dat文件,所以我在一个.csv文件中收集它们。

path =r'/Users/Desktop/03/17'
filenames = glob.glob(path + "/*dat")

dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))

data_day = pd.concat(dfs,ignore_index=True)    
data_day.head()
data_day.to_csv('/Users/Desktop/11.csv',index=False)
data2 = pd.read_csv('/Users/Desktop/11.csv', sep=' ')

data1 = data2.dropna(axis=1)
data1

这种类型的.dat文件包含21列,效果很好。 21 columns 但不适用于包含27列的此类文件。 27 columns 它不是27列,而是18列的文件。 我的错是什么?

1 个答案:

答案 0 :(得分:0)

链接文件中的分隔符不是单个空格,因此pd.read_csv(..., sep=' ')失败。尝试pd.read_csv(..., delim_whitespace=True)使用任意数量的空格作为分隔符。这应该大致相当于pd.read_csv(..., sep='\s+'),但更快。