Question

我需要合并3个不同文件夹中的3个csv文件，然后对每行的值进行平均（每个文件中约有4000行。

我设法将熊猫数据框与glob和所需的访问文件结合在一起。但是，当我连接文件时，顺序不同于我想要的顺序。

path = '/home/alispahic/1.CB1_project/12.Production_Runs/'
all_files = glob.glob(path + '*/3.IVa*/rmsf.csv')

li = []

for filename in all_files:
    data = pd.read_csv(filename, index_col=None, header=0)
    data['Atom']=data['Atom'].astype(int)
    data['(nm)']=data['(nm)'].astype(float)

    df1=data['Atom']
    df2=data['(nm)']


    li.append(df2)

frame = pd.concat(li, axis=0, ignore_index=True)

我想要做的是有一个输出，这些文件的值的顺序将不仅仅合并到一列中，而是包含3列，每行4000行，并像这样访问值。

Answer 1

您需要沿着列轴进行串联以获取3列：

frame = pd.concat(li, axis=1, ignore_index=True)

解析简明文件的起点

1 个答案: