解析简明文件的起点

时间:2019-05-21 09:18:02

标签: python arrays pandas concat glob

我需要合并3个不同文件夹中的3个csv文件,然后对每行的值进行平均(每个文件中约有4000行。

我设法将熊猫数据框与glob和所需的访问文件结合在一起。但是,当我连接文件时,顺序不同于我想要的顺序。

enter image description here

path = '/home/alispahic/1.CB1_project/12.Production_Runs/'
all_files = glob.glob(path + '*/3.IVa*/rmsf.csv')

li = []

for filename in all_files:
    data = pd.read_csv(filename, index_col=None, header=0)
    data['Atom']=data['Atom'].astype(int)
    data['(nm)']=data['(nm)'].astype(float)

    df1=data['Atom']
    df2=data['(nm)']


    li.append(df2)

frame = pd.concat(li, axis=0, ignore_index=True)

我想要做的是有一个输出,这些文件的值的顺序将不仅仅合并到一列中,而是包含3列,每行4000行,并像这样访问值。

1 个答案:

答案 0 :(得分:0)

您需要沿着列轴进行串联以获取3列:

frame = pd.concat(li, axis=1, ignore_index=True)