R:顺序系列滞后

时间:2018-08-25 07:07:40

标签: r series sequential

我需要R方面的帮助:我正在尝试确定两个变量的连续序列中的差距。 目前,我有一个看起来像这样的列表。

data <- fetch(rs, n=-1)
names(data) <- c("~Open", "~Close")

Browse[2]> typeof(data)
[1] "list"

~Open    ~Close
10000     10019
10020     10039
10040     10051  -> Gap from 10052->10060 : I need 10040-10060
10060     10079
10100     10119  -> Gap from 10080->10099 : I need 10060-10099 or 10080-10099
10160     10179  -> Gap from 10120->10159 : I need 10120-10159 or 10100-10159

我的结果应该看起来像一个缺少记录的列表(开始,停止)。 例如:

Open        Close
10040       10060
10080       10099
10100       10159

Open        Close
10040       10099
10120       10159

有人可以指出正确的方向吗?

谢谢。

更新:正在尝试:

gaps <- data %>% 
  mutate(lead_start = lead(Open) - 1) %>% 
  filter(Close != lead_start) %>% 
  transmute(Open = Close + 1, Close = lead_start)

我收到以下错误消息:

Error in mutate_impl(.data, dots) : 
  Evaluation error: object 'Open' not found.

我实际上只需要这样做:

data <- fetch(rs, n=-1)
lastOpen <- data[dim(data)[1], 2]
lastOpen <- lastOpen - lastOpen %% 20;
gaps <- as_tibble(data) %>% 
  mutate(lead_start = lead(Open) - 1) %>%
  filter(Close != lead_start) %>% 
  transmute(Open = (Close + 1) - ((Close + 1) %% 20), Close = lead_start) %>%
  add_row(Open = lastOpen, Close = Sys.time())

感谢mkeskisa !!!!!

1 个答案:

答案 0 :(得分:0)

我不确定我是否完全理解您要达到的目标,但是我认为这将帮助您弥补缺失的差距。您说您想要缺失的差距,但是您提供的列表将与您之前的差距重叠。例如。 10040至10060与10060至10079至10060重叠。通常,您可以通过使用滞后和/或超前来实现您想要做的事情。

library(tidyverse)
df <- tibble::tribble(
  ~Start,  ~Stop,
  10000L, 10019L,
  10020L, 10039L,
  10040L, 10051L,
  10060L, 10079L,
  10100L, 10119L,
  10160L, 10179L
  )

gaps <- df %>% 
  mutate(lead_start = lead(Start) - 1) %>% 
  filter(Stop != lead_start) %>% 
  transmute(start = Stop + 1, stop = lead_start)

gaps
# A tibble: 3 x 2
  start  stop
  <dbl> <dbl>
1 10052 10059
2 10080 10099
3 10120 10159