从大型数据集计算每月平均值

时间:2020-09-10 19:35:40

标签: mutate

我目前正在更新现有代码,以使用不同的分析时间来评估大型数据文件。我正在尝试复制一大堆代码,这些代码根据六个月的中位数评估数据,并更新它以根据每月平均值分析数据。我对R相当陌生,因此感谢您的帮助。不幸的是,数据文件是我的工作专有的,但是下面的代码块可以无缝地找到六个月的中位数

#制作6个月平均值数据表 SixMonthMedian <-tbl_df(W_Objectives [which(W_Objectives $ AveragingPeroid == 183),])

SixMonthMedian $ SampleDate <-ymd(SixMonthMedian $ SampleDate)

#根据需要过滤的d并根据均值进行合并以制作新的数据框 SixMonthMedian2 <-SixMonthMedian%>%安排(SampleDate)%>% dplyr :: group_by(AnalyteName,BeneficialUse,UnitName,StationCode,ProjectName,MatrixName ,FractionName,Waterbody,WBID,Objective_Language,Evaluation_Guideline ,Objective_Ref_Number,Eval_Ref_Number)%>% mutate(interval = cumsum(SampleDate-lag(SampleDate,default = min(SampleDate))> = 183))%>% dplyr :: group_by(interval,add = TRUE)%>% dplyr :: summarise(SampleDate = max(SampleDate),Objective =平均值(Objective),Result =中位数(Result))%>% 选择(AnalyteName,SampleDate,BeneficialUse,UnitName,StationCode,ProjectName,MatrixName ,分数名称,水体,WBID,目标,目标语言,评估指南 ,Objective_Ref_Number,Eval_Ref_Number,结果)

到目前为止,我已经编写了以下代码,但是不确定用MonthlyMean替换数字值是否可行

#过滤出每月平均值 MonthlyMean <-tbl_df(W_Objectives [which(W_Objectives $ AveragingPeriod == {MonthlyMean),])

MonthlyMean $ SampleDate <-ymd(MonthlyMean $ SampleDate)

#根据需要过滤的d并根据均值进行汇总,制作一个新的数据框 MonthlyMean2 <-MonthlyMean%>%安排(SampleDate)%>% dplyr :: group_by(AnalyteName,BeneficialUse,UnitName,StationCode,ProjectName,MatrixName ,FractionName,Waterbody,WBID,Objective_Language,Evaluation_Guideline ,Objective_Ref_Number,Eval_Ref_Number)%>%

0 个答案:

没有答案