我有一个大型的时间序列数据集,从雨站采集每小时一次。为了评估数据的质量,我想知道哪些日子不应该进行24次测量。
这是我的数据框架的结构,其中Date列已经是POSIXct格式:
Date Time Rain
1 2014-12-05 10:00 AM 0
2 2014-12-05 12:00 PM 0
3 2014-12-05 1:00 PM 0
4 2014-12-05 2:00 PM 0
5 2014-12-05 3:00 PM 0
6 2014-12-05 4:00 PM 0
7 2014-12-05 5:00 PM 0
8 2014-12-05 6:00 PM 0
9 2014-12-05 7:00 PM 0
10 2014-12-05 8:00 PM 0
有没有一种方法可以计算每天的行数,然后创建一个表格,显示日期和测量次数,如果每天少于24次?
谢谢!
答案 0 :(得分:1)
你可以试试这个
tab = table(df$Date)
tab[which(tab<24)]
答案 1 :(得分:1)
library(dplyr)
df %>%
count(Date) %>%
filter(n() < 24)