R中的read.xlsx时日期不一致

时间:2019-04-18 18:38:15

标签: r date

我在R中使用read.xlsx函数读取Excel工作表。日期列“ A”的所有值的格式均为dd / mm / yyyy。但是,使用read.xlsx函数时,解析日期的值的范围是整数,即。 42283字符串,即20/08/2015。即使当我使用read.xlsx2时,该探针仍然存在。

我猜想不同行的格式不一致会导致很难将列更改为单一标准格式。另外,由于我有100多个变量,因此很难在read.xlsx中指定列类。

有没有解决这个问题的方法,这也是excel特有的问题吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

这个日期格式的问题无处不在,似乎每个R软件包对它的处理方式都不同。我对read.xlsx的经验是,它有时会将日期保存为数字字符串,例如然后将“ 42438”作为字符数据转换为数字,然后转换为POSIXct。然后,有时似乎将其另存为数字,有时另存为字符,有时又另存为POSIXct!如果您始终以“ 20/08/2015”的形式获取字符数据,请尝试使用lubridate软件包:

 library(lubridate)
 dmy("20/08/2015")