减去一列中的值并更改另一个

时间:2019-12-01 11:17:19

标签: r date dataframe hour

我有一个看起来像这样的数据框:

structure(list(V1 = c(1174060957322141696, 1174107739209043968, 
1175456617980149760, 1175463444805558272, 1175475052307013632, 
1175916108697808896, 1177035962104369152, 1177959867077791744, 
1180512511436709888, 1179879113844236288), V2 = structure(c(573L, 
595L, 87L, 88L, 91L, 67L, 561L, 100L, 77L, 1L), .Label = c("Fri Oct 04 00:01:16 CEST 2019", 
"Sat Oct 05 13:55:30 CEST 2019", "Sat Oct 05 13:55:56 CEST 2019", 
"Wed Oct 02 10:25:36 CEST 2019", "Wed Oct 02 11:47:16 CEST 2019", 
"Wed Oct 02 23:43:18 CEST 2019", "Wed Oct 02 23:46:07 CEST 2019", 
"Wed Oct 02 23:52:27 CEST 2019", "Wed Oct 02 23:54:42 CEST 2019", 
"Wed Oct 02 23:55:50 CEST 2019", "Wed Oct 02 23:56:11 CEST 2019", 
"Wed Oct 02 23:56:41 CEST 2019", "Wed Oct 02 23:57:12 CEST 2019", 
"Wed Oct 02 23:58:02 CEST 2019", "Wed Oct 02 23:58:53 CEST 2019", 
"Wed Oct 02 23:59:05 CEST 2019", "Wed Oct 02 23:59:16 CEST 2019", 
"Wed Oct 02 23:59:42 CEST 2019", "Wed Sep 18 01:47:53 CEST 2019", 
"Wed Sep 25 00:50:36 CEST 2019", "Wed Sep 25 01:06:26 CEST 2019"
), class = "factor")), row.names = c(NA, 10L), class = "data.frame")

我想通过减去07:00:00来更改V4列中的小时。如果V4列中的小时数小于07:00:00,则还应更改V3列中的日期,并且如果该日期到达前一个月,则应更改V2列中的月份。这样做的最终目的是计算每天可以使用多少行: count(entertainment_one,c(“ V2”,“ V3”)) 但在我需要重新组织数据框之前。 我是R新手,不知道从哪里开始。任何帮助将不胜感激,非常感谢!

1 个答案:

答案 0 :(得分:0)

首先要注意的是,您的V2是一个因素;他们的行为不像您想象的那样。快速将其转换回字符向量!

df$V2 <- as.character(df$V2)

现在,让我们将日期作为实际的日期时间向量。但首先,将语言环境设置为英语,因为您的日期似乎是英语。否则,将使用不同于您的计算机的其他语言来解析日期:

Sys.getlocale('LC_TIME') # take note of this value if you want to reset it.
Sys.setlocale('LC_TIME', 'english')  # works on windows

df$dates <- strptime(df$V2, '%a %b %d %T CEST %Y', tz='XXX')

您看到了'XXX'-这是因为我不知道CEST是什么时区。如果您所有的日期都在同一时区,那么您可能不会注意到...

这时,df$dates是POSIXlt类对象。尝试添加10(或1或任何小整数)

df$dates + 1
 [1] "2019-10-04 00:01:17 EDT" "2019-10-05 13:55:31 EDT" "2019-10-05 13:55:57 EDT" ...

啊,这是秒。 因此,要减去7个小时,就需要减去7个小时的秒数:

df$offset <- df$dates - 7 * 60 * 60

请参见,日期和月份都会相应更改。现在,使用软件包lubridate提取日期和月份组成部分:

library(lubridate)
month(df$offset)
day(df$offset)