我们共享汽车,价格取决于时间段。因此,我们有一个从7:00到20:00°时钟的“白天价格”和一个从20:00到7:00°时钟的“夜间价格”。当某人某天使用汽车时,我想计算白天的总小时数-夜间。因此可以计算出汽车的使用价格。
我需要另外两列,例如“日光”和“夜”。我正在寻找一种快速的方法来执行此操作,因为有几百亿股。
输入:
id; begin; end
1; 2019-06-03 14:00; 2019-06-06 03:30
预期输出:
id; begin; end; daylight; night
1; 2019-06-03 14:00; 2019-06-06 03:30; 32; 29.5
答案 0 :(得分:1)
对于精确地在午夜开始和结束的日期来说,这很容易。粗略估计是每24小时每天有11个小时的夜间时间和13个小时的白天,因此将这两个日期相乘并分别乘以11和13。
对于其余记录,我们可以将边缘情况分解为两组:
您可能已经猜到了,我们只需将三个部分加在一起即可:1)从开始时间到午夜,2)从午夜后开始到午夜前,以及3)从午夜开始到结束小时。
对于1)和3),我选择将夜间划分为上午和下午的时间。
添加更多要检查的案例,我们可以执行以下操作:
library(dplyr)
library(lubridate)
df <- read.table(text='id; begin; end
1; 2019-06-03 14:00; 2019-06-06 03:30
2; 2019-06-03 22:00; 2019-06-06 14:00
3; 2019-06-03 02:00; 2019-06-06 22:30', sep=';', header=TRUE) %>%
mutate_at(vars(begin, end), as.POSIXct)
df %>% mutate(
begin_date = floor_date(begin, 'd'),
hours_into_begin_day = hour(begin) + minute(begin)/60,
begin_morning = pmax(0, pmin(7, 7-hours_into_begin_day)),
begin_daylight = pmax(0,pmin(13, 20 - hours_into_begin_day)),
begin_evening = pmin(24 - hours_into_begin_day , 4),
hours_into_end_day = hour(end) + minute(end)/60,
end_morning = pmin(7, hours_into_end_day),
end_daylight = pmax(0, pmin(13, hours_into_end_day-7)),
end_evening = pmax(0,hours_into_end_day-20),
days_between = floor_date(end, 'd') - ceiling_date(begin, 'd'),
daylight = as.integer(days_between) * 13 + begin_daylight + end_daylight,
night = as.integer(days_between) * 11 + begin_morning + begin_evening + end_morning + end_evening
)
# id begin end begin_date hours_into_begin_day begin_morning begin_daylight begin_evening hours_into_end_day end_morning end_daylight end_evening days_between daylight night
# 1 2019-06-03 14:00:00 2019-06-06 03:30:00 2019-06-03 14 0 6 4 3.5 3.5 0 0.0 2 days 32 29.5
# 2 2019-06-03 22:00:00 2019-06-06 14:00:00 2019-06-03 22 0 0 2 14.0 7.0 7 0.0 2 days 33 31.0
# 3 2019-06-03 02:00:00 2019-06-06 22:30:00 2019-06-03 2 5 13 4 22.5 7.0 13 2.5 2 days 52 40.5
尝试摆弄pmin
和pmax
语句以了解它们的工作原理。它们的使用违反了我们的直觉(IMHO),并且比例如begin_morning = ifelse(hours_into_begin_day < 7, hours_into_begin_day - 7, 0)
,这是我的第一种方法。