我是熊猫和蟒蛇的新手。我有一个我不明白的问题,我有一组.dat文件,所以我在一个.csv文件中收集它们。
path =r'/Users/Desktop/03/17'
filenames = glob.glob(path + "/*dat")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
data_day = pd.concat(dfs,ignore_index=True)
data_day.head()
data_day.to_csv('/Users/Desktop/11.csv',index=False)
data2 = pd.read_csv('/Users/Desktop/11.csv', sep=' ')
data1 = data2.dropna(axis=1)
data1
这种类型的.dat文件包含21列,效果很好。 21 columns 但不适用于包含27列的此类文件。 27 columns 它不是27列,而是18列的文件。 我的错是什么?
答案 0 :(得分:0)
链接文件中的分隔符不是单个空格,因此pd.read_csv(..., sep=' ')
失败。尝试pd.read_csv(..., delim_whitespace=True)
使用任意数量的空格作为分隔符。这应该大致相当于pd.read_csv(..., sep='\s+')
,但更快。