我有两个夏季的每小时降水量值,它们是从2012-2013年间从Durango数据站收集的流量数据。对于这项研究,我正在每小时分析每个降水事件如何影响河流流量。无论天气如何,排放数据每隔15分钟,每小时,每天都有数据。降水数据只有几个小时下雨的时间。这是我对前几个降水事件所做的两个图表:
#after loading in my .CSVs 'animas' and 'durango':
disc1 <- animas[c(8700:9000), c(3,5)]
prec1 <- durango[c(3:11),c(6:7)]
ggplot(data = disc1, aes(x=datetime, discharge))+geom_point()+theme(axis.text.x = element_text(angle = 45, hjust = 1))
ggplot(data = prec1, aes(x=DATE, HPCP))+ geom_point()+ theme(axis.text.x = element_text(angle = 45, hjust = 1))
discharge, all hours get plotted Precipitation, missing hours as zeros
对于我的目标来说,降水在缺少小时的情况下进行绘图的方式是不可接受的。我需要以某种方式生成这些丢失的小时数,并用零填充空的降水(“ HPCP”)值,以便可以在与放电相同的时间范围内绘制它。
还有没有办法将这些数据分成单独的降水事件,但排除总量小于0.05英寸的事件? (与手动设置数百个降水事件的所有时限相反)。我需要生成发生降水事件的小时数集,并添加这些小时数的放电值。最终将绘制这些图,并计算峰值降雨与峰值排放之间的时间差。我应该使用什么数据结构?如何使用?
这似乎很困难,因为在所有情况下都不存在降水小时之间的零;例如,来自不同日期的两次降雨事件可能在相邻的行中,一个接一个。如何快速分类?可以在开始/结束时间前后6小时添加一条尾巴以包含点吗?
我已经弄乱了.csv,以获得两种可能的日期/时间配置(此文件中的HPCP为precip)。哪个更方便和使用ggplots进行绘图?
HPCP中所有带有0的小时都是带有“ F”标记的测量小时,这意味着检测到痕量的降水。这些对于我的分析来说太微不足道了。
谢谢。