如何在多个csv文件中收集样本

时间:2017-04-10 13:47:04

标签: python pandas dataframe

我有以下文件

file1.csv,file2.csv....

我想从每个csv文件中提取样本。

我试过

f1=pd.read_csv(file1.csv)

f1.sample(2)

f1.append(f2)

我试着循环并追加。

我猜有些解决方案更快。

如何在多个csv文件中收集样本?

2 个答案:

答案 0 :(得分:3)

我认为你可以使用:

files = glob.glob('files/*.csv')

df = pd.concat([pd.read_csv(f).sample(2) for f in files], ignore_index=True)

答案 1 :(得分:2)

试试这个:

# sample size
N = 10
df = pd.concat([pd.read_csv(f).sample(N) for f in file_list], ignore_index=True)