Question

我目前有一个包含大量行的大量数据集，我想创建一个较小的数据框，只会从较大的数据框中拉出2列，并且在这个实例的章节中每个名称出现了多少次＆＃39;出现＆＃39;

以下代码就是我正在使用的

 df1 = (Dec16.groupby(["BNF Chapter", "Name"]).size().reset_index(name="Occurrence"))
df1

它绘制了这个

BNF Chapter       Name                                       Occurrence 
1                 Aluminium hydroxide                           2
1                 Aluminium hydroxide + Magnesium trisilicate   2
1                 Alverine                                      702
.......
21              Polihexanide                                     2
21              Potassium hydroxide                              32
21              Sesame oil                                       22
21              Sodium chloride                                  222

我想得到的是某一章最常出现的十大名称，因为数据集太大了。

例如，只拉动的数据帧第1章中最常见的十大名称

我将如何做到这一点？

非常感谢!!!

Answer 1

您可以使用此pandas.DataFrame.count

这个Count Values In Pandas Dataframe可以帮助你，希望

从pandas jupyterbnote book中的count中查找最常见的值

1 个答案: