循环遍历由groupby生成的数据帧

时间:2016-05-25 17:33:27

标签: python ipython

      df2 = df.groupby('ActualDebugData')['HardwareId'].count().to_frame(name='df1')

数据帧df2的输出是:

      ActualDebugData    df1

      Bell               3212
      Bell Mobile        514

我想循环遍历df2,并声明Bell和Bell mobile都是相同的,因此添加了相应的df1。

最终输出必须是

      Bell               3726

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

在分组之前,你可以运行这样的事情,假设你在空格上分裂:

df['HardwareId_list'] = df['HardwareId'].str.split(' ')
df['hardware_updated'] = df['HardwareId_list'].apply(lambda x: x[0] if type(x) == list else x)

然后你可以像以前一样分组。

以上编辑评论

如果您有一个列表,请先将该列表应用为映射,然后进行分组。