连接点和间隔数据

时间:2012-10-16 03:43:24

标签: python pandas

我需要加入两个时间序列:

第一个是价格的时间序列 像这样

ticker date       price 
SBUX   01/01/2012 55

第二个时间序列是调整因子,表示为

ticker start_date end_date    adjustment_factor
SBUX   01/01/1993 01/01/1994  0.015

如何在熊猫中加入这些时间序列,以表达表达式中调整后的价格

adjusted_price = historical_prices * adjustment_factor

我知道我需要使用date_range函数将adjust_factor间隔时间序列扩展为每日系列。 但问题是调整时间序列的每一行都会有不同的日期范围 - 有没有办法从整个调整因子时间序列的间隔日期类型批量转换,而不是为每一行进行。

我已经发现我需要将第一个时间点的时间序列转移到列中并将日期划分为行,并且第二个时间序列将时间间隔扩展为每日粒度并将其转动(通过dataframe.pivot)通过组合两个数据帧,可以编写我需要的功能。

1 个答案:

答案 0 :(得分:0)

您可以简单地将dataFrame与日常栏一起加入,并使用fillna(method =“ffill”)来转发填充之前的值。在您的示例中,您有一个范围的调整因子。

#suppose sbux is an ohlc daily bar and adj is your adjustment factors  
adj  = pandas.DataFrame({"adj":pandas.Series(values,index = start_dates)})
sbux_with_adj  = sbux.join(adj)
sbux_with_adj["Adj"] =    sbux_with_adj["Adj"].fillna(method="ffill")
ohlc = sbux_with_adj[["Open","High","Low","Close"]] * sbux_with_adj["adj"]

我会采用以下方式调整更常见的调整因素(例如.985,1.5%股息):

sbux_with_adj  = sbux.join(adj)
sbux_with_adj["Adj"] =    sbux_with_adj["Adj"].fillna(1.0)
#now reverse cumulated adjustment.
cumulated_adj = sbux_with_adj["Adj"].cumprod().values[::-1] 
ohlc = sbux_with_adj[["Open","High","Low","Close"]] * cumulated_adj