这里有新的Python用户。我正在使用的代码是遍历一个充满.exp文件的目录。它正在将我的数据读入数组。踢球者是这些文件具有可变数量的列(一些有22个,有些有32个,但在每个文件中,这些行都具有相同的列数)。
indata = np.genfromtxt(infile,delimiter = '\t',usecols=xrange(32),dtype=[('Cycle','i3'),('Time','S12'),('107Ag','float'), #...etc.
有没有办法使用pd.read来克服这个问题?或者我应该建立某种条件结构(似乎笨重)?当遇到空列时,读者是否有办法打破并继续使用下一个文件?
答案 0 :(得分:0)
看起来您的数据没有标题,并且每个文件的左侧第一列应该对齐(即,如果文件A有10列而文件B有15,则每个文件的前10个对齐)。在那种情况下:
import glob
import pandas as pd
combined = []
for filepath in glob.glob('path/to/your/files/*.exp'):
combined.append(pd.read_table(filepath, sep='\t', header=None))
combined = pd.concat(combined, ignore_index=True)