使用Python

时间:2018-05-02 21:18:53

标签: python python-3.x statistics analytics multiple-records

我的数据框看起来像这样:

ID   Date  Name    ColA    ColB    ColC    ColD     Column_Interest
 1  09/12   Ann  String  String  String  String            OneThing
 2  09/13  Pete  String  String  String  String            OneThing
 2  09/13  Pete  String  String  String  String        AnotherThing
 3  09/13   Ann  String  String  String  String            OneThing
 3  09/13   Ann  String  String  String  String        AnotherThing
 3  09/13   Ann  String  String  String  String          ThirdThing
 4  09/12  Pete  String  String  String  String            OneThing

我想做什么:

  1. 按ID创建描述性统计信息。因此,举例来说,我想知道所有的“Column_Interest”和#39; Column_Interest' ID'的选择= 3.我可以看到他们在查看数据框时选择了几个选项,但我无法弄清楚应该如何对该数据进行分组以进行分析。
  2. 查看最常见的组合。例如,对于那些包含多行的ID,“Column_Interest”下的最常见组合是什么?我应该注意到我对选择的顺序不感兴趣。

0 个答案:

没有答案