Question

我对python很陌生。我已经搜索了这个问题的答案，但是恐怕我不知道要找到它的正确关键词。

我有一个熊猫df，由一列序列号和它们拥有的一些参数组成。例如：SN1具有参数A和B，SN2具有参数A和C，等等。

Serial        Parameter  
SN1              A
SN1              B
SN2              C
SN2              B
SN3              D
SN4              A 
SN4              B 
SN5              D

当我执行df.groupby（[Serial，Parameter]）。sum（）时，我生成一个新表，该表删除了“ Serial”中的重复项，并提供了更清晰的图片，其中哪个SN包含哪些参数组合。

Serial      Parameter
SN1         A 
            B
SN2         A
            C
            B
SN3         D
SN4         A 
            B
SN5         D

我有兴趣从中产生一个新表，该表显示出现在我的数据框中的所有参数组合的计数，以便我可以生成条形图，以显示哪种组合最不常见。

我想它看起来像这样，其中'Combination＃'是一个新添加的列，用于索引每个参数组合。 “组合计数”也是一个添加的列，它是该索引和参数组合保留的频率的计数，并仅显示该组合是什么组合。

 Combination #       Combination Count  Parameter 
    1                  2                  A
                                          B
                                          C
    2                  2                  D 
    3                  1                  A
                                          C
                                          B

即使使用groupby，我也有正确的方法吗？一些提示会有所帮助。

谢谢！

编辑：为清楚起见。

Groupby两列-组合的帕累托

0 个答案: