我目前有一个停车数据的数据框,由大约700,000行和5列组成。如下面的链接所示。
每当泊车状态发生变化时(即某个地点从parking_present变为Parking_empty或相反),数据库都会记录数据。我想填写数据集,以便在没有更改的情况下用数据填充它。数据集每两分钟更新一次,因此我也希望对其进行更新。
到目前为止,我已经编写了以下代码以尝试对其进行填写。
new <- dataset %>%
mutate(timezoned_event_timestamp = as.POSIXct(timezoned_event_timestamp))
complete(timezoned_event_timestamp = seq(floor_date(min(new$timezoned_event_timestamp), "day"), max(new$timezoned_event_timestamp), 1)) %>%
fill(c(parking_bay_string_id, latitude, longitude, type), .direction = "up")
我的问题是,它似乎没有为每个parking_bay_string_id创建新行。我使用了一个count函数,其中一些具有很多值(260,000),而另一些则只有1。
如何解决我的代码,使每个不同的parking_bay_string_id具有相等的行数,以反映每两分钟更新一次的数据?