R:查找和删除具有特定日期的行

时间:2019-04-22 09:32:21

标签: r date posixct

我对R很陌生。 这是我的问题: 我有一个很大的.txt文件,有10万行, 该任务是删除所有包含日期​​晚于例如本月的行。

日期的格式为%Y-%m-%dT%H:%M:%S.%f+00:00

一行示例,但其中可能包含数量不固定的单词:INFO: 2018-11-21T09:53:55.467550+00:00 (none) setaupasqa[12]: 0012f73ad1a26

我已经尝试过使用这种方法(日期时间函数)来查找日期,但是似乎不起作用

Date <- read.delim("my_data.txt")
Date <- as.POSIXct(Date, format= "%Y-%m-%dT%H:%M:%S.%f+00:00", tz="UTC")
as.POSIXlt(Date)$year + 1900 

谢谢。

1 个答案:

答案 0 :(得分:0)

您可以为此使用lubridate。 示例示例:

library(data.table)
library(dplyr)
df <- fread("sample.txt", header = F)
df$V2 <- lubridate::ymd_hms(df$V2)

#Filter all rows with month >= 11
df %>%
  filter(month(V2) >= 11)
V1                  V2     V3              V4            V5
1 INFO: 2018-11-22 09:53:55 (none) setaupasqa[12]: 0012f73ad1a26

样本数据

$ cat sample.txt
INFO: 2018-10-21T09:53:55.467550+00:00 (none) setaupasqa[12]: 0012f73ad1a26
INFO: 2018-11-22T09:53:55.467550+00:00 (none) setaupasqa[12]: 0012f73ad1a26