现在我写了一些脚本,可以分析来自Hadoop的每日转储文件。我想要的是让我的R脚本在新数据可用后每天凌晨4点运行。是否有来自R端或OS端的脚本可以自动执行此操作?
我能想到的是让另一个R脚本空转并继续检查系统时间来决定调用我的脚本来运行,但是这太多了吗?除非必要,否则我更愿意关闭R.
好的,我明白了答案。在运行大规模数据处理任务方面,是否有人有评论R和Python之间稳定性的经验。
答案 0 :(得分:3)
http://www.thegeekstuff.com/2009/06/15-practical-crontab-examples/
- 或者更好 -
http://tgmstat.wordpress.com/2013/09/11/schedule-rscript-with-cron/
这些网站应该是你需要的所有东西。假设你正在使用linux。
答案 1 :(得分:2)
您可以使用此代码
Sys.time()
for(period in 1:365){
{
your code here
}
newdate=as.POSIXct("2014-11-14 04:00:00 GMT")+24*60*60*period
Sys.sleep( newdate - Sys.time() )
}