使用R计算时间序列中的缺失值

时间:2016-10-15 03:33:24

标签: r time-series

我有一个大型的时间序列数据集,从雨站采集每小时一次。为了评估数据的质量,我想知道哪些日子不应该进行24次测量。

这是我的数据框架的结构,其中Date列已经是POSIXct格式:

     Date       Time      Rain
1  2014-12-05  10:00 AM    0
2  2014-12-05  12:00 PM    0
3  2014-12-05   1:00 PM    0
4  2014-12-05   2:00 PM    0
5  2014-12-05   3:00 PM    0
6  2014-12-05   4:00 PM    0
7  2014-12-05   5:00 PM    0
8  2014-12-05   6:00 PM    0
9  2014-12-05   7:00 PM    0
10 2014-12-05   8:00 PM    0

有没有一种方法可以计算每天的行数,然后创建一个表格,显示日期和测量次数,如果每天少于24次?

谢谢!

2 个答案:

答案 0 :(得分:1)

你可以试试这个

tab = table(df$Date)
tab[which(tab<24)]

答案 1 :(得分:1)

library(dplyr)

df %>% 
  count(Date) %>% 
  filter(n() < 24)