********更新了问题,更好的代码示例,现在使用列表理解**********
我正在尝试使用pandas和talib每周滚动技术指标。
通过“每周滚动”我的意思是,如果例如今天是星期四,则今天的ADX周价值将仅使用此星期四,前一个星期四等来计算。每周一次ADX系列中的ADX仅使用周三等计算。所以现在,有一天过去了,我们站在星期五,只有星期五应该用来计算每周ADX。 最后,ADX系列就是所有这些ADX附加在一个系列中。
目前,我使用列表推导生成5个列在“adxs_list”中的列表,每个列表是一周中的某一天。 因此,例如,adxs_list [0]显示仅使用星期一计算的talib.ADX值,adxs_list [1],显示仅使用星期二计算的talib.ADX值,依此类推。
现在,当我试图将这些列表放回原始数据帧时,我陷入困境。 试图将它们混合在一起,然后将它们添加到DataFrame但无法弄明白......
所以问题是,如何将这些计算加入到关于df索引的原始数据框中?
import pandas as pd
import numpy as np
import talib
df = pd.DataFrame(np.random.randn(1000,4),
index=pd.date_range(pd.datetime(2000,3,30), freq='B', periods=1000),
columns =['PX_OPEN', 'PX_LAST', 'PX_HIGH', 'PX_LOW'] )
lista4 = ['W-MON','W-TUE','W-WED','W-THU','W-FRI']
adxs_list = [([talib.ADX(df['PX_HIGH'].resample(w).values,
df['PX_LOW'].resample(w).values, df['PX_LAST'].resample(w).values
, timeperiod=3)]) for w in lista4]
正试图这样做:
adxs_frame = reduce(pd.DataFrame.combine_first,adxs_list)
得到了这个错误:
TypeError:必须使用DataFrame实例作为第一个参数调用unbound方法combine_first()(获取列表实例)
答案 0 :(得分:1)
最后,我想我想通了。必须转置然后重新分配原始索引。不确定它是否是最快的方式,但在这里:
import pandas as pd
import numpy as np
import talib
df = pd.DataFrame(np.random.randn(100,4),
index=pd.date_range(pd.datetime(2000,3,30), freq='B', periods=100),
columns =['PX_OPEN', 'PX_LAST', 'PX_HIGH', 'PX_LOW'] )
lista3 = ['PX_OPEN', 'PX_LAST', 'PX_HIGH', 'PX_LOW']
lista4 = ['W-MON','W-TUE','W-WED','W-THU','W-FRI']
i0=[]
i1=[]
i2=[]
i3=[]
i4=[]
adxs_list = [([talib.ADX(df['PX_HIGH'].resample(w).values,
df['PX_LOW'].resample(w).values, df['PX_LAST'].resample(w).values
, timeperiod=3)]) for w in lista4]
# transposing the arrays and assigning them the original index of that week day
for u,v in [(u,v) for u,v in zip(range(5),lista4)]:
r = "i{0} = pd.DataFrame(adxs_list[{0}]).transpose().set_index(df.PX_OPEN.resample('{1}').index)".format(u,v)
exec r
# combining all the new dataframes into a single dataframe (respecting their indexes)
y0 = [i0, i1, i2, i3, i4]
i_frame = reduce(pd.DataFrame.combine_first, y0)
# merging this new dataframe into the original df
df = df.merge(i_frame, left_index=True, right_index=True)
# for some strange reason new column is named 0, so renaming it
names = df.columns.values
names[-1] = 'ADX_w'
df.columns = names