我有一个df
,其中有3列,最后一列包含组的code_name。
这是我的df
date value name
0 2015-02-26 0.033308 4332_1_2
1 2015-03-30 0.089551 4332_1_2
2 2015-04-15 0.518057 4332_1_2
3 2015-05-01 0.184956 4332_1_2
4 2015-05-17 0.291904 4332_1_2
我想基于name
列对此df进行迭代,这意味着在每次迭代中,将仅包含具有相同名称的行。我使用的方法是一个“简单”循环:
for i in df['name'].unique():
df_temp = df[df['name']==i].copy()
do something with df_temp...
如何改善迭代?
答案 0 :(得分:1)
这看起来像是
df.groupby('name').apply(...)
您不会用原始循环来击败它的性能。