如何基于列值有效地迭代熊猫数据框

时间:2020-06-12 12:26:29

标签: python-3.x pandas loops iteration

我有一个df,其中有3列,最后一列包含组的code_name。 这是我的df

的负责人
    date         value      name
0   2015-02-26  0.033308    4332_1_2
1   2015-03-30  0.089551    4332_1_2
2   2015-04-15  0.518057    4332_1_2
3   2015-05-01  0.184956    4332_1_2
4   2015-05-17  0.291904    4332_1_2

我想基于name列对此df进行迭代,这意味着在每次迭代中,将仅包含具有相同名称的行。我使用的方法是一个“简单”循环:

for i in df['name'].unique():
    df_temp = df[df['name']==i].copy()
    do something with df_temp...

如何改善迭代?

1 个答案:

答案 0 :(得分:1)

这看起来像是

df.groupby('name').apply(...)

您不会用原始循环来击败它的性能。