我有一个数据框,其中显示了最近购买的某产品的航班购买信息(由Purchase_date表示)以及该时间段之前由(return_date)表示的时间的返还预订总数。
我正在尝试创建一个变量,该变量显示给定时间段内基于最近的购买和最近的总退货的重新预订的百分比。
我有两个数据框:
DF1-根据产品的退货日期显示产品的总预订量。
product return_date total_bookings
<fct> <date> <dbl>
# product_A 2018-05-26 4
# product_A 2019-01-24 9
# product_A 2019-10-25 5
# product_B 2018-09-18 12
# product_B 2018-10-25 30
# product_B 2019-03-16 4
DF2-显示最近一次旅行返回(即date_last_return)的产品的最新预订总数。其想法是它显示自上次退货以来再次购买产品的人数。
product date_last_return purchase_date bookings
<fct> <date> <date> <dbl>
# product_A 2018-10-25 2019-02-12 2
# product_A 2019-01-24 2019-06-14 2
# product_A 2018-05-26 2019-06-28 2
# product_B 2018-09-18 2018-11-01 2
# product_B 2018-10-25 2019-02-06 1
# product_B 2019-03-16 2019-06-13 2
我要执行的操作是基于退货日期是否为采购日前6个月,汇总DF1的所有“退货预订”总数。
例如:
product purchase_date re-bookings total_6month_return
1 product_A 2019-02-12 2 9
2 product_A 2019-06-14 2 9
3 product_A 2019-06-28 2 9
4 product_B 2018-11-01 2 42
5 product_B 2019-02-06 1 42
6 product_B 2019-06-13 2 4
我很难通过DF2中的Purchase_date来汇总DF1的方法,而且似乎找不到解决方案。
如果您在R中对如何实现此功能有任何编码建议,我将不胜感激。我认为for循环会比较合适,但我根本不知道。