Question

我有一个df，其中有3列，最后一列包含组的code_name。这是我的df

的负责人

    date         value      name
0   2015-02-26  0.033308    4332_1_2
1   2015-03-30  0.089551    4332_1_2
2   2015-04-15  0.518057    4332_1_2
3   2015-05-01  0.184956    4332_1_2
4   2015-05-17  0.291904    4332_1_2

我想基于name列对此df进行迭代，这意味着在每次迭代中，将仅包含具有相同名称的行。我使用的方法是一个“简单”循环：

for i in df['name'].unique():
    df_temp = df[df['name']==i].copy()
    do something with df_temp...

如何改善迭代？

Answer 1

这看起来像是

df.groupby('name').apply(...)

您不会用原始循环来击败它的性能。

如何基于列值有效地迭代熊猫数据框

1 个答案: