熊猫-产生最后一位数字的下一个最近年份

时间:2018-08-13 23:06:18

标签: python pandas dataframe

在计算某些金融工具的到期日时,通常我们要做的只是以下内容:

Trade Date  RIC
5/22/1989   SPH0
5/23/1989   SPH0
5/24/1989   SPH0
5/25/1989   SPH0
5/26/1989   SPH0

交易日期为交易工具的日期,而RIC为4个字母的字符串,由以下组成:

First 2 characters = an asset class
3rd character = expiration month
last character = last digit of expiration year

说明有效期:

month_codes_to_int = {'F':'1', 'G':'2', 'H':'3', 'J':'4', 'K':'5', 'M':'6', 
             'N':'7', 'Q':'8', 'U':'9', 'V':'10', 'X':'11', 'Z':'12'}

我通过使用交易日期和RIC为每一行生成一个到期年...我这样做是通过遍历DF并每次使用一个将正确计算到期日期。

for index, row in df.iterrows():
    row['Trade Date'] = pd.to_datetime(row['Trade Date'])
    print(row['Trade Date'], row['RIC'])
    current_year = row['Trade Date'].year
    asset_class = row['RIC'].split[0:3]
    expiration_month = row['RIC'][2]
    expiration_year_last_digit = row['RIC'][3]
    expiration_year = 

我的方法是将到期日期设为与当前日期相距最近的月份和年份,因此对于1989年5月22日,该日期应为1990年3月15日(1990年的日期无关紧要)是最接近的年份,以0到1989结尾。)

是否有一种使用pandas datetime功能自动执行此操作的方法?

1 个答案:

答案 0 :(得分:1)

首先,创建一个包含月份,年份以及TradeDate列的最后一位的系列。

m = df.RIC.str[2].map(month_codes_to_int)
y = df.RIC.str[3].astype(int)
s = df.TradeDate.dt.year.mod(10)

然后计算您的偏移量:

offset = np.where(y==s, 0, 10+y-s)

最后,创建您的新列:

pd.to_datetime((df.TradeDate.dt.year + offset).astype(str) + m, format='%Y%m')

输出:

0   1990-03-01
1   1990-03-01
2   1990-03-01
3   1990-03-01
4   1990-03-01
dtype: datetime64[ns]