使用熊猫计算回溯期

时间:2018-09-10 06:25:28

标签: pandas lookback

我需要在每行中向后回顾不同的时间并计算新病人,所以就像我从日期回首并在上个月检查新病人,然后在上个月的第二个月检查新病人,依此类推。 / p>

我的数据集是这样的:  在此图中,我要从上一个RX_FILL_DT开始,然后从上个月开始检查到两年 This is my Data Set

这是我的数据集

  

PATIENT_Id> RX_FILL_DT> RX_QUANTITY> DAYS_SUPPLY

     

106208> 3/25/2010> 20> 30

     

1240316> 5/15/2010> 15> 30

     

1381727> 2010年8月26日> 10> 28

     

1381727> 2010年1月17日> 10> 28

     

1381808> 2010/6/6> 30> 30

     

1381938> 2010/4/16> 45> 90

     

1381938> 2010年8月3日> 15> 30

     

1381938> 9/4/2010> 15> 30

     

1381938> 9/14/2010> 15> 30

     

1381938> 2010年9月30日> 15> 27

     

1381961> 6/8/2010> 15> 25

     

1381961> 7/1/2010> 15> 23

     

1381961> 7/8/2010> 15> 25

     

1381961> 7/28/2010> 15> 23

     

1381961> 8/19/2010> 15> 25

     

最长日期为2010年9月30日

我的输出应如下所示:

             lookback 1 month >   lookback 2 month    >lookback 3 months
     

新患者人数> 0> 0> 0
  Lookback calculation can been seen here

New Patients = post - common (between prior and post)

如果患者在回溯时间范围内没有任何记录,则为新患者。

例如,对于一个月的回溯,特定的患者编号只有一个条目,则表示该患者是新患者,并且在回溯为一个月时进行计数。

请帮助我是熊猫新手。

我的代码是这样的:

  

onlyDip = pd.read_table(“ C:\ Users \ aa18957 \ Desktop \ Transactions.txt”,sep =“ |”)

     

onlyDip ['RX_FILL_DT'] = pd.to_datetime(onlyDip ['RX_FILL_DT'])

我正在尝试使用pandas.Series.rolling,但是不确定如何计算新患者。

0 个答案:

没有答案