我有一个DataFrame
需要根据特定列进行细分并写入不同的Excel文件...
df = pd.DataFrame(np.arange(28).reshape((7, 4)))
df['group'] = ['a', 'a', 'c', 'c', 'd', 'd', 'e']
0 1 2 3 group
0 0 1 2 3 a
1 4 5 6 7 a
2 8 9 10 11 c
3 12 13 14 15 c
4 16 17 18 19 d
5 20 21 22 23 d
6 24 25 26 27 e
基于列group
我需要拆分并写入xlsx文件...我目前正在使用
for group in list(df['group'].unique()):
group_df = df[df['group'] == group]
group_df.to_excel(some_path)
有没有办法可以同时执行此操作,而不是使用for循环??
答案 0 :(得分:1)
排序。你仍然需要一个for循环来突破各个线程。
话虽这么说,但您在这里使用并发性并未获得任何性能提升。您没有外部阻止API,并且您的操作肯定是IO限制而不是CPU。