假设我有这样的数据:
+--------+-------+----------+
| module | topic | duration |
+--------+-------+----------+
| a | a | 1 |
| a | b | 3 |
| a | a | 5 |
| b | d | 6 |
| b | e | 6 |
| b | f | 3 |
+--------+-------+----------+
我要转换为这样的数据:
+--------+-------+
| module | topic |
+--------+-------+
| a | a |
| a | b |
| b | d |
| b | e |
| b | f |
+--------+-------+
在带有熊猫的Python中,我可以执行以下操作
topics.groupby(['module', 'topic'], as_index=False).size().reset_index(name='count').drop(['count'], axis=1)
但是必须有一个更好的方法!如何在不通过聚合功能运行每个组的情况下将数据帧分组到熊猫中?