我有以下文件
file1.csv,file2.csv....
我想从每个csv文件中提取样本。
我试过
f1=pd.read_csv(file1.csv)
f1.sample(2)
f1.append(f2)
我试着循环并追加。
我猜有些解决方案更快。
如何在多个csv文件中收集样本?
答案 0 :(得分:3)
我认为你可以使用:
files = glob.glob('files/*.csv')
df = pd.concat([pd.read_csv(f).sample(2) for f in files], ignore_index=True)
答案 1 :(得分:2)
试试这个:
# sample size
N = 10
df = pd.concat([pd.read_csv(f).sample(N) for f in file_list], ignore_index=True)