我有一个看起来像这样的数据框:
structure(list(V1 = c(1174060957322141696, 1174107739209043968,
1175456617980149760, 1175463444805558272, 1175475052307013632,
1175916108697808896, 1177035962104369152, 1177959867077791744,
1180512511436709888, 1179879113844236288), V2 = structure(c(573L,
595L, 87L, 88L, 91L, 67L, 561L, 100L, 77L, 1L), .Label = c("Fri Oct 04 00:01:16 CEST 2019",
"Sat Oct 05 13:55:30 CEST 2019", "Sat Oct 05 13:55:56 CEST 2019",
"Wed Oct 02 10:25:36 CEST 2019", "Wed Oct 02 11:47:16 CEST 2019",
"Wed Oct 02 23:43:18 CEST 2019", "Wed Oct 02 23:46:07 CEST 2019",
"Wed Oct 02 23:52:27 CEST 2019", "Wed Oct 02 23:54:42 CEST 2019",
"Wed Oct 02 23:55:50 CEST 2019", "Wed Oct 02 23:56:11 CEST 2019",
"Wed Oct 02 23:56:41 CEST 2019", "Wed Oct 02 23:57:12 CEST 2019",
"Wed Oct 02 23:58:02 CEST 2019", "Wed Oct 02 23:58:53 CEST 2019",
"Wed Oct 02 23:59:05 CEST 2019", "Wed Oct 02 23:59:16 CEST 2019",
"Wed Oct 02 23:59:42 CEST 2019", "Wed Sep 18 01:47:53 CEST 2019",
"Wed Sep 25 00:50:36 CEST 2019", "Wed Sep 25 01:06:26 CEST 2019"
), class = "factor")), row.names = c(NA, 10L), class = "data.frame")
我想通过减去07:00:00来更改V4列中的小时。如果V4列中的小时数小于07:00:00,则还应更改V3列中的日期,并且如果该日期到达前一个月,则应更改V2列中的月份。这样做的最终目的是计算每天可以使用多少行: count(entertainment_one,c(“ V2”,“ V3”)) 但在我需要重新组织数据框之前。 我是R新手,不知道从哪里开始。任何帮助将不胜感激,非常感谢!
答案 0 :(得分:0)
首先要注意的是,您的V2
是一个因素;他们的行为不像您想象的那样。快速将其转换回字符向量!
df$V2 <- as.character(df$V2)
现在,让我们将日期作为实际的日期时间向量。但首先,将语言环境设置为英语,因为您的日期似乎是英语。否则,将使用不同于您的计算机的其他语言来解析日期:
Sys.getlocale('LC_TIME') # take note of this value if you want to reset it.
Sys.setlocale('LC_TIME', 'english') # works on windows
df$dates <- strptime(df$V2, '%a %b %d %T CEST %Y', tz='XXX')
您看到了'XXX
'-这是因为我不知道CEST是什么时区。如果您所有的日期都在同一时区,那么您可能不会注意到...
这时,df$dates
是POSIXlt类对象。尝试添加10
(或1或任何小整数)
df$dates + 1
[1] "2019-10-04 00:01:17 EDT" "2019-10-05 13:55:31 EDT" "2019-10-05 13:55:57 EDT" ...
啊,这是秒。 因此,要减去7个小时,就需要减去7个小时的秒数:
df$offset <- df$dates - 7 * 60 * 60
请参见,日期和月份都会相应更改。现在,使用软件包lubridate
提取日期和月份组成部分:
library(lubridate)
month(df$offset)
day(df$offset)