在R中:如何提取有关有效时间段的信息并将其应用于另一个数据集?

时间:2019-03-21 15:54:25

标签: r time dplyr period

我必须要合并的数据集:

数据集1:包含“ perc”有效的时间段:

set.seed(1)

example_df <- data.frame(ID = rep(1:2, each=2),   
start = c(as.Date("2014-01-01"), as.Date("2014-03-05"), as.Date("2014-01-13"), as.Date("2014-03-15")), 
                         end = c(as.Date("2014-03-05"), as.Date("2014-04-12"), as.Date("2014-03-01"), as.Date("2014-04-02")), 
                         perc = rnorm(mean= 30, sd= 10, 4)) 

数据集2:包含每个月的工资:

 month_start <- as.Date("2014-01-01") + months(0:3)
    month_end <-  ceiling_date(month_start, "month") - days(1)

set.seed(1)
example_df2 <-  data.frame(month_start, month_end,
                           ID = rep(1:2, each=4),
                           pay = rnorm(mean= 2000, sd= 80, 8))

目标是根据每个人的工作绩效多少来计算每个月的工资。重要的是要考虑到perc的有效时间段,该时间段可能会在一个月内更改。

例如:

ID 1:2014年1月:付款= 1949.884(付款)* 23.73546(性能)/ 100

因为perc在整个一月份都有效。

但是,对于3月,直到3日,perc均为23.73546,对于3月其余时间,perc为31.83643。

因此

ID为1的2014年3月:工资= 1949.884(工资)* 23.73546(perc)/ 100/31(3月的天)* 5 + 1949.884(工资)* 31.83643(perc)/ 100/31(3月的天) * 26

1 个答案:

答案 0 :(得分:0)

从两个数据帧之间的left_join()开始。 ID的每个工作期间将在此ID的每个发薪月期间进行复制。 然后,我们继承ifelse(),您可以确定是否应该计算总月数,只计算一部分,还是根本不计算。

library(tidyverse)

result <- example_df %>% 
  left_join(example_df2, by = 'ID') %>% 
  mutate(
    TEST_MONTH = ifelse(end >= month_start & start < month_end, 1, 0), 
    TEST_DAYS  = ifelse(TEST_MONTH == 1,
                        ifelse(end > month_end,
                               ifelse(start >= month_start, month_end - start + 1, month_end - month_start + 1), 
                               end - month_start + 1), 
                        0),
    PAID = pay * perc/100 * TEST_DAYS / as.numeric(month_end - month_start + 1)
  )

result %>% filter(ID == 1)

# ID      start        end     perc month_start  month_end      pay TEST_MONTH TEST_DAYS      PAID
# 1  1 2014-01-01 2014-03-05 23.73546  2014-01-01 2014-01-31 1949.884          1        31 462.81390
# 2  1 2014-01-01 2014-03-05 23.73546  2014-02-01 2014-02-28 2014.691          1        28 478.19633
# 3  1 2014-01-01 2014-03-05 23.73546  2014-03-01 2014-03-31 1933.150          1         5  74.00678
# 4  1 2014-01-01 2014-03-05 23.73546  2014-04-01 2014-04-30 2127.622          0         0   0.00000
# 5  1 2014-03-05 2014-04-12 31.83643  2014-01-01 2014-01-31 1949.884          0         0   0.00000
# 6  1 2014-03-05 2014-04-12 31.83643  2014-02-01 2014-02-28 2014.691          0         0   0.00000
# 7  1 2014-03-05 2014-04-12 31.83643  2014-03-01 2014-03-31 1933.150          1        27 536.03354
# 8  1 2014-03-05 2014-04-12 31.83643  2014-04-01 2014-04-30 2127.622          1        12 270.94364