在R中有条件地使用滞后值

时间:2018-07-21 16:03:21

标签: r loops

我想做的是将split_coefficient!= 1的行中的split_coefficient值用于数据帧中以前日期的Adjusted_close的计算中。我正在尝试在R中创建一个循环,该循环将把splitted_coefficient乘以Adjusted_close值,直到但不包括包含split = coefficient等于!= 1的行,并重复该过程直至数据集的末尾。我能够使用which(y[,6] !=1来标识split_coefficients!= 1的那些行,但是无法弄清楚如何编写循环来完成此任务。任何有关如何创建此循环的帮助将不胜感激。预先谢谢你。

timestamp   open    high    low close   adjusted_close  split_coefficient
7/20/2018   31.61   31.72   30.95   31.04   31.04   1
7/19/2018   31.17   31.57   30.69   31.19   31.19   1
7/18/2018   30.53   31.33   30.26   30.63   30.63   1
7/17/2018   31.67   31.825  30.49   30.89   30.89   1
7/16/2018   31.24   31.79   31  31.23   31.23   1
7/13/2018   32.06   32.37   31.36   31.45   31.45   1
7/12/2018   32.29   32.68   31.69   31.69   31.69   1
7/11/2018   33.37   33.47   32.43   32.93   32.93   1
7/10/2018   32.19   32.8185 31.75   31.84   31.84   1
7/9/2018    33.32   33.37   32.249  32.48   32.48   0.25
7/6/2018    36.03   36.17   34.15   34.23   34.23   1
7/5/2018    36.47   37.46   36.05   36.09   36.09   1
7/3/2018    36.28   37.8299 36  37.33   37.33   1
7/2/2018    38.74   39.22   37.03   37.08   37.08   1
6/29/2018   36.71   37.06   35.78   37  37  1
6/28/2018   38.88   40.51   37.46   38.03   38.03   0.35
6/27/2018   36.14   39.43   35.21   38.56   38.56   1
6/26/2018   36.54   37.89   35.715  36.48   36.48   1
6/25/2018   34.24   39.745  34.24   38.11   38.11   1
6/22/2018   33.04   33.57   32.72   33.06   33.06   1
6/21/2018   32.26   34.84   32.21   34.15   34.15   1
6/20/2018   32.13   32.21   31.655  32.02   32.02   0.5
6/19/2018   33.33   33.92   32.43   32.79   32.79   1
6/18/2018   32.55   33.02   31.19   31.24   31.24   1
6/15/2018   31.94   32.52   31.52   31.67   31.67   1
6/14/2018   31.5    31.83   30.91   31.33   31.33   1
6/13/2018   31.58   32.45   31.44   32.39   32.39   1
6/12/2018   31.86   32.41   31.66   31.97   31.97   1
6/11/2018   32.67   32.77   31.91   32.09   32.09   1
6/8/2018    33.46   33.56   32.41   32.6    32.6    1

我将尝试澄清我的问题: 在6/20/18上,分离系数为0.50。我要做的是将0.5的split_coefficient乘以6/8/18到6/19/18的Adjusted_close值。然后split_coefficient在6/28/18上更改为0.35,在这里我想将Adjusted_close从6/21/18乘以6/27/18乘以0.35。由于split_coefficient会定期变化,因此我认为一个循环或一系列循环将完成此操作。

基于我在上面的内容,我正在寻找带有新列New.adj.Close的以下输出,该列将包含将split / coefficient从6/20/18乘以6/8的Adjusted_close值得出的值/ 18-6/19/18:

timestamp   open    high    low close   adjusted_close  dividend_amount split_coefficient   New.Adj.close
6/19/2018   33.33   33.92   32.43   32.79   32.79   0   1   16.395
6/18/2018   32.55   33.02   31.19   31.24   31.24   0   1   15.62
6/15/2018   31.94   32.52   31.52   31.67   31.67   0   1   15.835
6/14/2018   31.5    31.83   30.91   31.33   31.33   0   1   15.665
6/13/2018   31.58   32.45   31.44   32.39   32.39   0   1   16.195
6/12/2018   31.86   32.41   31.66   31.97   31.97   0   1   15.985
6/11/2018   32.67   32.77   31.91   32.09   32.09   0   1   16.045
6/8/2018    33.46   33.56   32.41   32.6    32.6    0   1   16.3

3 个答案:

答案 0 :(得分:1)

为澄清起见,您是否只想将adjusted_close等于1的观察值乘以split_coefficientsplit_coefficient?如果是这样,

library(dplyr)
y %>% filter(split_coefficient == 1) %>% mutate(new_col = split_coefficient *adjusted_close)

很抱歉,如果我误解了这个问题。

答案 1 :(得分:1)

如注释中突出显示的那样,通常避免使用R中的循环,并且可以使用更好的替代方法。例如,您可以使用ifelse

df <-
  data.frame(
    adjusted_close = sample(1:5, 10, TRUE),
    split_coefficient = sample(1:2, 10, TRUE)
  )

#    adjusted_close split_coefficient
# 1               5                 1
# 2               2                 2
# 3               3                 2
# 4               2                 2
# 5               4                 2
# 6               5                 2
# 7               1                 1
# 8               2                 1
# 9               2                 2
# 10              2                 1

df$m <- ifelse(df$split_coefficient == 1,
               df$adjusted_close, 
               df$adjusted_close * df$split_coefficient
               )

# df
#    adjusted_close split_coefficient  m
# 1               5                 1  5
# 2               2                 2  4
# 3               3                 2  6
# 4               2                 2  4
# 5               4                 2  8
# 6               5                 2 10
# 7               1                 1  1
# 8               2                 1  2
# 9               2                 2  4
# 10              2                 1  2

答案 2 :(得分:1)

好的,这可以使用tidyverse,但是您可以将其重新编码为使用base r或其他任何形式。重要的是逻辑。 如前所述,您通常不希望对这样的任务使用循环,在这种情况下,您将必须执行do while循环。而是利用矢量化技术。

measure_date <- seq(as.Date("2000/1/1"), by = "day", length.out = 20)
pattern <- c(.5, 1,1,1,1)
split_coefficient <- c(pattern, pattern, pattern, pattern)
value_to_multiply <- c(1:20)

df <- data.frame(measure_date, value_to_multiply, split_coefficient)

# doing this because OP's data is reversed
df <- dplyr::arrange(df, measure_date)

# Change the 1s to NAs.

df$newsplit <- ifelse(df$split_coefficient == 1, NA, df$split_coefficient)

df <- tidyr::fill(df , newsplit)
df$multiplied <- df$value_to_multiply*df$newsplit
df

结果

   measure_date value_to_multiply split_coefficient newsplit multiplied
1    2000-01-01                 1               0.5      0.5        0.5
2    2000-01-02                 2               1.0      0.5        1.0
3    2000-01-03                 3               1.0      0.5        1.5
4    2000-01-04                 4               1.0      0.5        2.0
5    2000-01-05                 5               1.0      0.5        2.5
6    2000-01-06                 6               0.5      0.5        3.0
7    2000-01-07                 7               1.0      0.5        3.5
8    2000-01-08                 8               1.0      0.5        4.0
9    2000-01-09                 9               1.0      0.5        4.5
10   2000-01-10                10               1.0      0.5        5.0
11   2000-01-11                11               0.5      0.5        5.5
12   2000-01-12                12               1.0      0.5        6.0
13   2000-01-13                13               1.0      0.5        6.5
14   2000-01-14                14               1.0      0.5        7.0
15   2000-01-15                15               1.0      0.5        7.5
16   2000-01-16                16               0.5      0.5        8.0
17   2000-01-17                17               1.0      0.5        8.5
18   2000-01-18                18               1.0      0.5        9.0
19   2000-01-19                19               1.0      0.5        9.5
20   2000-01-20                20               1.0      0.5       10.0