计算时间序列中的缺失值

时间:2015-09-04 08:37:48

标签: python python-3.x pandas

我正在使用Python和Pandas来分析数据系列。我的DF看起来像这样

                          ActivePowerkW  WindSpeedms  WindSpeedmsstd 
time                                                              
    2015-05-26 11:40:00       836.6328     8.234862        1.414558   
    2015-05-26 11:50:00       968.5992     8.761620        1.572579   
    2015-05-26 12:30:00       614.0503     7.267871        1.575504   
    2015-05-26 13:50:00       945.5604     8.709115        1.527079   
    2015-05-26 14:00:00       926.6531     8.538967        1.589221   
    2015-05-26 14:30:00       666.7984     7.590645        1.324495   
    2015-05-26 14:40:00       911.0134     8.466603        1.708189   
    2015-05-26 15:10:00      1256.1740     9.868224        1.636775   
    2015-05-26 15:30:00      1706.7070    11.225540        1.576277 

省略空值。我想将所有空值按月计算为百分比。

我认为最简单的方法是创建一个新的时间序列

timeseries_comp = pd.date_range(df.index[0], df.index[df_length], freq='10min')

然后将其与我的df

对齐
dif = df.align(timeseries_comp)

然后只计算NAN。这不起作用。对齐错误unsupported type

我最后的意思是以下

Availability

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

好的,我{ "states": [ { "status": "BV", "median": 240.0, "drilldown": "BV" }, { "status": "CORR", "median": 720.0, "drilldown": "CORR" } ], "drilldown": [ { "name":"BV", "data": [ { "median": 100.0, "disease_name": "Lupus" }, { "median": 128.0, "disease_name": "Pulmonary Arterial Hypertension" } ] }, { "name":"CORR", "data": [ { "median": 321.0, "disease_name": "Lupus" }, { "median": 670.0, "disease_name": "Rheumatology" } ] } ] } 使用您的time_series,然后使用reindex索引,然后应用groupby并致电isnull

sum