我最近一直在玩R.的技术交易技术。
我确实发现的一个问题,特别是对于大的高频信息,正在从信号矢量生成策略向量。我想知道使用dplyr
是否有更快的方式?
让我们首先下载Apple的股票并生成短期和长期移动平均线
library("TTR")
library("quantmod")
library("PerformanceAnalytics")
library("dplyr")
getSymbols("AAPL", src = "google")
stock <- AAPL
stock <- window(stock['2015-10-01::2017-01-01'])
# Plot if you want to see
#lineChart(stock)
Short <- EMA(Cl(stock), n=5)
Long <- EMA(Cl(stock), n=6)
我们现在拥有我们选择的股票,让我们生成信号向量,指示当两个移动平均线交叉时的买入和卖出订单
# Signal
Signal <-
Lag(ifelse(
Lag(Short) < Lag(Long) & Short > Long, 1,
ifelse(
Lag(Short) > Lag(Long) & Short < Long, -1, 0)
))
Signal[is.na(Signal)] <- 0
之后我们使用这个信号构建策略 - 这是高频数据需要很长时间的部分 - 这显然是由于for
循环
# Strategy
Strategy <- ifelse(Signal > 1, 0, 1)
for (i in 1:length(Cl(stock))) {
Strategy[i] <-
ifelse(Signal[i] == 1, 1, ifelse(Signal[i] == -1, 0, Strategy[i - 1]))
}
x <- as.numeric(Strategy$Lag.1)
x[is.na(x)] <- 0
我目前的dplyr方法如下,但它会产生错误的策略
dplyr_strat <-
Signal %>% tbl_df() %>%
mutate(Change = if_else(Lag.1 == -1, "Sell", "Buy", "NoChange") ) %>%
mutate(Strategy = ifelse(Change == "Buy", 1,
ifelse( Change == "Sell", 0,
lag(Strategy)) ) ) %>% select(Strategy)
y <- as.numeric(dplyr_strat$Strategy)
并测试
all.equal(x,y)
答案 0 :(得分:1)
我同意epi99关于保持与初始for循环一致的评论。我使用了data.table并得到了完全匹配,见下文:
## Using data.table
dt.Signal <- setDT(as.data.frame(Signal))
dt.Signal[, Strategy := ifelse(Lag.1 == 1, 1, ifelse(Lag.1 == -1, 0, lag(Strategy)))]
dt.Signal[is.na(dt.Signal)] <- 0
z <- as.numeric(dt.Signal[, Strategy])
all.equal(x,z)
您遇到的问题可能是“买入”,“卖出”和“无变化”逻辑