熊猫按两列分组,并获得唯一计数

时间:2020-03-13 16:26:38

标签: python pandas

我有以下数据框:

tar czvf data.tar.gz /opt/sonarqube/

我想获取每个小时的ID的唯一计数。意思是,我想要这样的东西:

   ID       hour                          
  3403       9
  3478       1
  3478       1
  3478       1
  3478       1
  3478       1
  3478       1
  3481       1
  3489       1
  3489       1
  3489       1
  3489       1
  3489       1
  3489       1
  3489       1
  3502       2
  3502       2
  3502       2

我该怎么做?
到目前为止,我所做的只是小时和ID分组,例如:

count     hour
  1        9
  3        1
  1        2 

但是不知道如何继续。

3 个答案:

答案 0 :(得分:0)

double[] myArray = scoreArray.ToArray();
File.WriteAllLines("scores.txt",
  Array.ConvertAll(myArray, x => x.ToString()));

答案 1 :(得分:0)

您可以简单地使用group by然后进行计数

df.groupby(['Hour','ID']).size().reset_index().groupby('Hour').Hour.value_counts()

答案 2 :(得分:0)

这可能有效-

df.groupby(['hour']).agg(count=('ID', 'nunique')).reset_index()