我有以下数据框:
tar czvf data.tar.gz /opt/sonarqube/
我想获取每个小时的ID的唯一计数。意思是,我想要这样的东西:
ID hour
3403 9
3478 1
3478 1
3478 1
3478 1
3478 1
3478 1
3481 1
3489 1
3489 1
3489 1
3489 1
3489 1
3489 1
3489 1
3502 2
3502 2
3502 2
我该怎么做?
到目前为止,我所做的只是小时和ID分组,例如:
count hour
1 9
3 1
1 2
但是不知道如何继续。
答案 0 :(得分:0)
double[] myArray = scoreArray.ToArray();
File.WriteAllLines("scores.txt",
Array.ConvertAll(myArray, x => x.ToString()));
答案 1 :(得分:0)
您可以简单地使用group by然后进行计数
df.groupby(['Hour','ID']).size().reset_index().groupby('Hour').Hour.value_counts()
答案 2 :(得分:0)
这可能有效-
df.groupby(['hour']).agg(count=('ID', 'nunique')).reset_index()