Question

我是熊猫和蟒蛇的新手。我有一个我不明白的问题，我有一组.dat文件，所以我在一个.csv文件中收集它们。

path =r'/Users/Desktop/03/17'
filenames = glob.glob(path + "/*dat")

dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))

data_day = pd.concat(dfs,ignore_index=True)    
data_day.head()
data_day.to_csv('/Users/Desktop/11.csv',index=False)
data2 = pd.read_csv('/Users/Desktop/11.csv', sep=' ')

data1 = data2.dropna(axis=1)
data1

这种类型的.dat文件包含21列，效果很好。 21 columns 但不适用于包含27列的此类文件。 27 columns 它不是27列，而是18列的文件。我的错是什么？

Answer 1

链接文件中的分隔符不是单个空格，因此pd.read_csv(..., sep=' ')失败。尝试pd.read_csv(..., delim_whitespace=True)使用任意数量的空格作为分隔符。这应该大致相当于pd.read_csv(..., sep='\s+')，但更快。

如何从没有空列的.dat文件中获取数据

1 个答案: