我正在研究/回测交易系统。
我有一个包含OHLC数据的Pandas数据框,并添加了几个calculated columns,用于识别我将用作启动头寸信号的价格模式。
我现在想添加一个能够跟踪当前净头寸的列。我尝试过使用df.apply(),但是将数据帧本身作为参数而不是行对象传递,就像后者一样,我似乎无法回顾之前的行来确定它们是否导致了任何价格模式: / p>
open_campaigns = []
Campaign = namedtuple('Campaign', 'open position stop')
def calc_position(df):
# sum of current positions + any new positions
if entered_long(df):
open_campaigns.add(
Campaign(
calc_long_open(df.High.shift(1)),
calc_position_size(df),
calc_long_isl(df)
)
)
return sum(campaign.position for campaign in open_campaigns)
def entered_long(df):
return buy_pattern(df) & (df.High > df.High.shift(1))
df["Position"] = df.apply(lambda row: calc_position(df), axis=1)
但是,这会返回以下错误:
ValueError: ('The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()', u'occurred at index 1997-07-16 08:00:00')
滚动窗口函数似乎很自然,但据我所知,它们只作用于单个时间序列或列,因此无法工作,因为我需要在多个时间点访问多列的值
我该怎么做呢?
答案 0 :(得分:5)
这个问题源于NumPy。
def entered_long(df):
return buy_pattern(df) & (df.High > df.High.shift(1))
entered_long
返回一个类似数组的对象。 NumPy拒绝猜测数组是True还是False:
In [48]: x = np.array([ True, True, True], dtype=bool)
In [49]: bool(x)
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
要解决此问题,请使用any
或all
指定数组为True的含义:
def calc_position(df):
# sum of current positions + any new positions
if entered_long(df).any(): # or .all()
如果any()
中的任何项都为True,则entered_long(df)
方法将返回True。
如果all()
中的所有项都为True,则entered_long(df)
方法将返回True。