我对python很陌生。我已经搜索了这个问题的答案,但是恐怕我不知道要找到它的正确关键词。
我有一个熊猫df,由一列序列号和它们拥有的一些参数组成。例如:SN1具有参数A和B,SN2具有参数A和C,等等。
Serial Parameter
SN1 A
SN1 B
SN2 C
SN2 B
SN3 D
SN4 A
SN4 B
SN5 D
当我执行df.groupby([Serial,Parameter])。sum()时,我生成一个新表,该表删除了“ Serial”中的重复项,并提供了更清晰的图片,其中哪个SN包含哪些参数组合。
Serial Parameter
SN1 A
B
SN2 A
C
B
SN3 D
SN4 A
B
SN5 D
我有兴趣从中产生一个新表,该表显示出现在我的数据框中的所有参数组合的计数,以便我可以生成条形图,以显示哪种组合最不常见。
我想它看起来像这样,其中'Combination#'是一个新添加的列,用于索引每个参数组合。 “组合计数”也是一个添加的列,它是该索引和参数组合保留的频率的计数,并仅显示该组合是什么组合。
Combination # Combination Count Parameter
1 2 A
B
C
2 2 D
3 1 A
C
B
即使使用groupby,我也有正确的方法吗?一些提示会有所帮助。
谢谢!
编辑:为清楚起见。