将字符转换为日期*快速*在R中

时间:2012-10-15 14:56:48

标签: r date character posix

  

可能重复:
  Why is as.Date slow on a character vector?

我使用data.frame从数据库中读取了大RMySQL(大约60万观测值)。日期以字符形式出现(似乎没有办法改变这一点)所以我使用as.Date将事物转换为日期。然而,这需要很长时间才能进行如此多的观察。有什么办法可以让它更快吗?

1 个答案:

答案 0 :(得分:20)

Simon Urbanek的fasttime非常快速获取可解析日期时间的一部分:

R> now <- Sys.time()
R> now
[1] "2012-10-15 10:07:28.981 CDT"
R> fasttime::fastPOSIXct(format(now))
[1] "2012-10-15 05:07:28.980 CDT"
R> as.Date(fasttime::fastPOSIXct(format(now)))
[1] "2012-10-15"
R> 

但是,它只解析ISO格式并假设UTC为时区。

3年半后编辑:一些评论者似乎认为快速软件包很难安装。我不敢苟同。这里(再一次)使用install.r这只是一个使用littler的简单包装器(并且还作为示例提供):

edd@max:~$ install.r fasttime
trying URL 'https://cran.rstudio.com/src/contrib/fasttime_1.0-1.tar.gz'
Content type 'application/x-gzip' length 2646 bytes
==================================================
downloaded 2646 bytes

* installing *source* package ‘fasttime’ ...
** package ‘fasttime’ successfully unpacked and MD5 sums checked
** libs
ccache gcc -I/usr/share/R/include -DNDEBUG      -fpic  -g -O2 -fstack-protector-strong -Wformat -Werror=format-security -D_FORTIFY_SOURCE=2 -g  -O3 -Wall -pipe -pedantic -std=gnu99  -c tparse.c -o tparse.o
ccache gcc -shared -L/usr/lib/R/lib -Wl,-Bsymbolic-functions -Wl,-z,relro -o fasttime.so tparse.o -L/usr/lib/R/lib -lR
installing to /usr/local/lib/R/site-library/fasttime/libs
** R
** preparing package for lazy loading
** help
*** installing help indices
** building package indices
** testing if installed package can be loaded
* DONE (fasttime)

The downloaded source packages are in
        ‘/tmp/downloaded_packages’
edd@max:~$ 

正如您所看到的,该软件包具有零外部依赖性,一个源文件和构建没有丝毫任何障碍。我们还可以看到fasttime现在在CRAN上,而在撰写答案时并非如此。这样,Windows和OS X二进制文件现在确实存在于该页面,即使您不从源代码安装,安装也将像我一样简单