Groupby两列-组合的帕累托

时间:2018-09-22 02:27:58

标签: python-3.x pandas-groupby

我对python很陌生。我已经搜索了这个问题的答案,但是恐怕我不知道要找到它的正确关键词。

我有一个熊猫df,由一列序列号和它们拥有的一些参数组成。例如:SN1具有参数A和B,SN2具有参数A和C,等等。

Serial        Parameter  
SN1              A
SN1              B
SN2              C
SN2              B
SN3              D
SN4              A 
SN4              B 
SN5              D

当我执行df.groupby([Serial,Parameter])。sum()时,我生成一个新表,该表删除了“ Serial”中的重复项,并提供了更清晰的图片,其中哪个SN包含哪些参数组合。

Serial      Parameter
SN1         A 
            B
SN2         A
            C
            B
SN3         D
SN4         A 
            B
SN5         D 

我有兴趣从中产生一个新表,该表显示出现在我的数据框中的所有参数组合的计数,以便我可以生成条形图,以显示哪种组合最不常见。

我想它看起来像这样,其中'Combination#'是一个新添加的列,用于索引每个参数组合。 “组合计数”也是一个添加的列,它是该索引和参数组合保留的频率的计数,并仅显示该组合是什么组合。

 Combination #       Combination Count  Parameter 
    1                  2                  A
                                          B
                                          C
    2                  2                  D 
    3                  1                  A
                                          C
                                          B      

即使使用groupby,我也有正确的方法吗?一些提示会有所帮助。

谢谢!

编辑:为清楚起见。

0 个答案:

没有答案