我一直在使用python和pandas中的数据框,其中包含第一列中的重复条目。数据框看起来像这样:
sample_id qual percent
0 sample_1 10 20
1 sample_2 20 30
2 sample_1 50 60
3 sample_2 10 90
4 sample_3 100 20
我想写一些标识第一列中重复条目的内容,并计算后续列的平均值。理想的输出类似于以下内容:
sample_id qual percent
0 sample_1 30 40
1 sample_2 15 60
2 sample_3 100 20
我整个下午一直在努力解决这个问题,并希望得到任何帮助。