有没有办法让它成为
df2=df2.resample('D',how="mean",label="left",closed="left")
需要一定数量的积分(比如10)来弥补平均值。 如果那天没有NaN那么
数据集如下:
2004-02-27 20:00:00,2.5666666666666678,0.8638333333333333,,,,,,,,2.5666666666666678,,,,,,4.9,1.0,1.0,1.9088083333333328,0.0214,2.218625,0.0214,246.66666666666663,9.866666666666667,0.0,1.0,1.0
2004-02-27 21:00:00,8.216666666666667,0.95425,,,,,,,,8.216666666666667,,,,,,4.9,1.0,1.0,1.909341666666667,0.0214,2.2172416666666668,0.0214,251.91666666666663,11.308333333333335,0.0,1.0,1.0
2004-02-27 22:00:00,5.116666666666666,0.9855,,,,,,,,5.116666666666666,,,,,,4.9,1.0,1.0,1.9110833333333337,0.0214,2.2185916666666663,0.0214,257.1666666666667,12.54166666666667,0.0,1.0,1.0
答案 0 :(得分:0)
您可以创建一个布尔掩码,告诉您存在足够的数据点。
enough_points = df2.resample("D", label="left", closed="left").count() >= 10
然后计算平均值并用掩码过滤它们。
means = df2.resample("D", label="left", closed="left").mean()
good_means = means[enough_points]