我有一个看起来像这样的数据框:
Index cpc subclass group
0 F21S9/02 F21S 9/02
1 F21S9/024 F21S 9/024
2 F21V15/013 F21V 15/013
3 F21V17/107 F21V 17/107
4 F21V23/005 F21V 23/005
5 F21V23/006 F21V 23/006
6 F21V29/76 F21V 29/76
7 F21V29/83 F21V 29/83
8 F21V31/005 F21V 31/005
9 F21W2131/103 F21W 2131/103
10 F21Y2105/10 F21Y 2105/10
11 F21Y2113/00 F21Y 2113/00
12 F21Y2115/10 F21Y 2115/10
我想创建一个新的数据框,将具有相同子类的所有组组合在一起,如下所示:
Index subclass groups
0 F21S 9/02, 9/024
1 F21V 15/013, 17/107, 23/005, 23/006, 29/76, 29/83, 31/005
2 F21W 2131/103
3 F21Y 2105/10 2113/00, 2115/10
我开始用计数器编写一些if循环,以比较每个索引处的子类值并组合它们的组,但这确实很复杂。有没有更简单的方法可以对付熊猫?也许是groupby?
我尝试了df.groupby(['subclass']).values
,但这给了我一个错误:
AttributeError: Cannot access attribute 'values' of 'DataFrameGroupBy' objects, try using the 'apply' method