现在,xlsx文件包含一个日期列,如:
Date
2019-3-1 0:15
2019-3-1 19:15
2019-3-1 23:15
如何将其作为读取日期和时间数据类型加载到data.frame中?我的工具是openxlsx包,我尝试过:
df <- readWorkbook(xlsxFile = '0301-0314.xlsx',sheet=1)
答案 0 :(得分:2)
首先,您使用任何库读取数据集。然后,您可以尝试as.POSIXlt
或as.POSIXct
定义日期时间格式。这还允许您提供时区信息以及日期时间格式。
示例:
> sampledf <- data.frame(DateTime = c("2019-3-1 0:15",
+ "2019-3-1 19:15",
+ "2019-3-1 23:15")
+ )
> str(sampledf$DateTime)
Factor w/ 3 levels "2019-3-1 0:15",..: 1 2 3
> sampledf$DateTime <- as.POSIXlt(sampledf$DateTime ,"GMT",format = "%Y-%m-%d %H:%M")
> str(sampledf$DateTime)
POSIXlt[1:3], format: "2019-03-01 00:15:00" "2019-03-01 19:15:00" ...
时区信息“ GMT”可以替换为任何时区。 here.
提供了有关R中不同时间格式选项的更多信息。答案 1 :(得分:1)
这将起作用:
# Create example dataset:
df <- data.frame(Date = c("2019-3-1 0:15",
"2019-3-1 19:15",
"2019-3-1 23:15")
)
df$Date <- as.character(df$Date)
# Format "Date" as date and time:
df$time <- strptime(as.character(df$Date), "%Y-%m-%d %H:%M")
# Check:
str(df)
# If then you would like to count time, for example in number of hours, from a certain initial time (e.g. 2019-3-1 0:15) try:
df$timestep <- as.numeric(difftime(time2="2019-3-1 0:15", time1=df$time, units="hours"))