这是为了创建最终的数据帧以进行分析,因此我有三种csv文件,我想从文件1和文件2中提取特定的列,然后将其串联到文件3中以获得单个csv文件。 >
我有一个文件夹,其中三种文件类型作为子文件夹->即3个子文件夹。这3个子文件夹包含来自实验不同部分的数据,并按参与者编号排序。例如,对于参与者1001,我在每个子文件夹中都有一个文件p1001,对于参与者1002同样,在每个文件夹中我都有p1002,依此类推。因此,对于每个参与者,我有三个同名但不同文件夹的文件。如何为每个参加者制作一个单独的csv文件,将单个文件夹的三个不同子文件夹中的选定列组合在一起?
import pandas as pd
import os, csv, pdb
import glob
a=[]
base_dir='/Users/...../Desktop/data/'
folders = ('All', 'Choice', 'Choice_S')
pattern = '{}/[{}]/**/filename.csv'.format(base_dir, ''.join(folders))
for filename in glob.glob(pattern):
filename=pd.DataFrame
df1=filename[filename['reaction_time']]
a.append[df1]