Question

我最近一直在玩R.的技术交易技术。

我确实发现的一个问题，特别是对于大的高频信息，正在从信号矢量生成策略向量。我想知道使用dplyr是否有更快的方式？

让我们首先下载Apple的股票并生成短期和长期移动平均线

library("TTR")
library("quantmod")
library("PerformanceAnalytics")
library("dplyr")

getSymbols("AAPL", src = "google")
stock <- AAPL
stock <- window(stock['2015-10-01::2017-01-01'])

# Plot if you want to see
#lineChart(stock)

Short <- EMA(Cl(stock), n=5)
Long <- EMA(Cl(stock), n=6)

我们现在拥有我们选择的股票，让我们生成信号向量，指示当两个移动平均线交叉时的买入和卖出订单

# Signal
Signal <-
  Lag(ifelse(
    Lag(Short) < Lag(Long) & Short > Long, 1,
    ifelse(
      Lag(Short) > Lag(Long) & Short < Long, -1, 0)
  ))
Signal[is.na(Signal)] <- 0

之后我们使用这个信号构建策略 - 这是高频数据需要很长时间的部分 - 这显然是由于for循环

# Strategy
Strategy <- ifelse(Signal > 1, 0, 1)
for (i in 1:length(Cl(stock))) {
  Strategy[i] <-
    ifelse(Signal[i] == 1, 1, ifelse(Signal[i] == -1, 0, Strategy[i - 1]))
}
x <- as.numeric(Strategy$Lag.1)
x[is.na(x)] <- 0

我目前的dplyr方法如下，但它会产生错误的策略

dplyr_strat <-
Signal %>% tbl_df() %>% 
  mutate(Change = if_else(Lag.1 == -1, "Sell", "Buy", "NoChange") ) %>% 
  mutate(Strategy = ifelse(Change == "Buy", 1, 
                           ifelse( Change == "Sell", 0, 
                                   lag(Strategy)) ) ) %>% select(Strategy)
y <- as.numeric(dplyr_strat$Strategy)

并测试

all.equal(x,y)

Answer 1

我同意epi99关于保持与初始for循环一致的评论。我使用了data.table并得到了完全匹配，见下文：

## Using data.table
dt.Signal <- setDT(as.data.frame(Signal))
dt.Signal[, Strategy := ifelse(Lag.1 == 1, 1, ifelse(Lag.1 == -1, 0, lag(Strategy)))]
dt.Signal[is.na(dt.Signal)] <- 0
z <- as.numeric(dt.Signal[, Strategy])

all.equal(x,z)

您遇到的问题可能是“买入”，“卖出”和“无变化”逻辑

用dplyr生成交易信号和策略

1 个答案: