将多个csv文件中的列合并到文件夹的子文件夹中的单个csv文件中

时间:2019-04-06 07:46:57

标签: python pandas glob data-analysis

这是为了创建最终的数据帧以进行分析,因此我有三种csv文件,我想从文件1和文件2中提取特定的列,然后将其串联到文件3中以获得单个csv文件。 >

我有一个文件夹,其中三种文件类型作为子文件夹->即3个子文件夹。这3个子文件夹包含来自实验不同部分的数据,并按参与者编号排序。例如,对于参与者1001,我在每个子文件夹中都有一个文件p1001,对于参与者1002同样,在每个文件夹中我都有p1002,依此类推。因此,对于每个参与者,我有三个同名但不同文件夹的文件。如何为每个参加者制作一个单独的csv文件,将单个文件夹的三个不同子文件夹中的选定列组合在一起?

import pandas as pd
import os, csv, pdb
import glob

a=[]
base_dir='/Users/...../Desktop/data/'
folders = ('All', 'Choice', 'Choice_S')
pattern = '{}/[{}]/**/filename.csv'.format(base_dir, ''.join(folders))
for filename in glob.glob(pattern):
    filename=pd.DataFrame
    df1=filename[filename['reaction_time']]
    a.append[df1]

0 个答案:

没有答案