我想按日期对数据进行子集化,并计算给定数据中两行之间的平均值。我的数据如下;
Station Date Month Day Year MaxTemp MinTemp MaxDewPoint MinDewPoint
ORD 1/1/1948 1 1 1948 35.6 26.6 34.16 -27.4
ORD 1/2/1948 1 2 1948 -2 -16 -16.96 -27.04
ORD 1/3/1948 1 3 1948 -4 -26 -12 -26
ORD 1/4/1948 1 4 1948 -5 -26 -15 -26
ORD 1/5/1948 1 5 1948 8 -25 3 -20
ORD 1/6/1948 1 6 1948 -11 -25 -24 -25
ORD 1/7/1948 1 7 1948 1 -23 -20 -23
ORD 1/8/1948 1 8 1948 1 -22 -9 -20
ORD 1/9/1948 1 9 1948 NaN -22 -5 -22
ORD 1/10/1948 1 10 1948 10 NaN -2 -22
ORD 1/11/1948 1 11 1948 -11 -21 -23 -21
ORD 1/12/1948 1 12 1948 3 -12 -7.96 -20.92
ORD 1/13/1948 1 13 1948 6.98 -7.6 -7.6 -20.2
ORD 1/14/1948 1 14 1948 3.92 -9.4 -11.2 -20
ORD 1/15/1948 1 15 1948 6 -7 -5.98 -20
ORD 1/16/1948 1 16 1948 3 -11 -7.96 -20.02
我一直到2018年都有此数据,但是2010年之后有很多缺失值,因此我想将其子集并计算两个MaxDewPoint和MinDewPoint之间的均值,如下所示;
Station Date Month Day Year MaxTemp MinTemp MaxDewPoint MinDewPoint Mean
ORD 1/1/1948 1 1 1948 35.6 26.6 34.16 -27.4 3.3
ORD 1/2/1948 1 2 1948 -2 -16 -16.96 -27.04 -22
ORD 1/3/1948 1 3 1948 -4 -26 -12 -26 -19
ORD 1/4/1948 1 4 1948 -5 -26 -15 -26 -20.5
ORD 1/5/1948 1 5 1948 8 -25 3 -20 8.5