我目前有一个包含大量行的大量数据集,我想创建一个较小的数据框,只会从较大的数据框中拉出2列,并且在这个实例的章节中每个名称出现了多少次'出现& #39;
以下代码就是我正在使用的
df1 = (Dec16.groupby(["BNF Chapter", "Name"]).size().reset_index(name="Occurrence"))
df1
它绘制了这个
BNF Chapter Name Occurrence
1 Aluminium hydroxide 2
1 Aluminium hydroxide + Magnesium trisilicate 2
1 Alverine 702
.......
21 Polihexanide 2
21 Potassium hydroxide 32
21 Sesame oil 22
21 Sodium chloride 222
我想得到的是某一章最常出现的十大名称,因为数据集太大了。
例如,只拉动的数据帧 第1章中最常见的十大名称
我将如何做到这一点?
非常感谢!!!