Question

我有一个DataFrame需要根据特定列进行细分并写入不同的Excel文件...

df = pd.DataFrame(np.arange(28).reshape((7, 4)))

df['group'] = ['a', 'a', 'c', 'c', 'd', 'd', 'e']


    0   1   2   3   group
0   0   1   2   3   a
1   4   5   6   7   a
2   8   9   10  11  c
3   12  13  14  15  c
4   16  17  18  19  d
5   20  21  22  23  d
6   24  25  26  27  e

基于列group我需要拆分并写入xlsx文件...我目前正在使用

for group in list(df['group'].unique()):
    group_df = df[df['group'] == group]
    group_df.to_excel(some_path)

有没有办法可以同时执行此操作，而不是使用for循环??

Answer 1

排序。你仍然需要一个for循环来突破各个线程。

话虽这么说，但您在这里使用并发性并未获得任何性能提升。您没有外部阻止API，并且您的操作肯定是IO限制而不是CPU。

同时将pandas DataFrame写入xlsx

1 个答案: