从xlsx文件加载数据作为日期和时间

时间:2019-03-15 09:24:05

标签: r date xlsx

现在,xlsx文件包含一个日期列,如:

Date
2019-3-1 0:15
2019-3-1 19:15
2019-3-1 23:15

如何将其作为读取日期和时间数据类型加载到data.frame中?我的工具是openxlsx包,我尝试过:

df <- readWorkbook(xlsxFile = '0301-0314.xlsx',sheet=1)

2 个答案:

答案 0 :(得分:2)

首先,您使用任何库读取数据集。然后,您可以尝试as.POSIXltas.POSIXct定义日期时间格式。这还允许您提供时区信息以及日期时间格式。 示例:

> sampledf <- data.frame(DateTime = c("2019-3-1 0:15",
+                            "2019-3-1 19:15",
+                            "2019-3-1 23:15")
+ )
> str(sampledf$DateTime)
 Factor w/ 3 levels "2019-3-1 0:15",..: 1 2 3
> sampledf$DateTime <- as.POSIXlt(sampledf$DateTime ,"GMT",format = "%Y-%m-%d %H:%M")
> str(sampledf$DateTime)
 POSIXlt[1:3], format: "2019-03-01 00:15:00" "2019-03-01 19:15:00" ...

时区信息“ GMT”可以替换为任何时区。 here.

提供了有关R中不同时间格式选项的更多信息。

答案 1 :(得分:1)

这将起作用:

# Create example dataset:
df <- data.frame(Date = c("2019-3-1 0:15",
                        "2019-3-1 19:15",
                        "2019-3-1 23:15")
                )
df$Date <- as.character(df$Date)
# Format "Date" as date and time:
df$time <- strptime(as.character(df$Date), "%Y-%m-%d %H:%M")
# Check:
str(df)
# If then you would like to count time, for example in number of hours, from a certain initial time (e.g. 2019-3-1 0:15) try:
df$timestep <- as.numeric(difftime(time2="2019-3-1 0:15", time1=df$time, units="hours"))