我需要合并3个不同文件夹中的3个csv文件,然后对每行的值进行平均(每个文件中约有4000行。
我设法将熊猫数据框与glob和所需的访问文件结合在一起。但是,当我连接文件时,顺序不同于我想要的顺序。
path = '/home/alispahic/1.CB1_project/12.Production_Runs/'
all_files = glob.glob(path + '*/3.IVa*/rmsf.csv')
li = []
for filename in all_files:
data = pd.read_csv(filename, index_col=None, header=0)
data['Atom']=data['Atom'].astype(int)
data['(nm)']=data['(nm)'].astype(float)
df1=data['Atom']
df2=data['(nm)']
li.append(df2)
frame = pd.concat(li, axis=0, ignore_index=True)
我想要做的是有一个输出,这些文件的值的顺序将不仅仅合并到一列中,而是包含3列,每行4000行,并像这样访问值。
答案 0 :(得分:0)
您需要沿着列轴进行串联以获取3列:
frame = pd.concat(li, axis=1, ignore_index=True)