对于这个特定项目,我每小时从互联网上收集数据并将其放入hadoop框架内的目录中。我需要在特定时间运行特定程序,而crontab是执行此操作的最佳方法。问题是我不知道如何创建新文件,将它们放在正确的目录中,并根据它们的制作时间命名它们。 Crontab完全按照命令行中的命令获取命令。我是否必须编写一个单独的程序来修改crontab文件,以便正确命名所有内容?
基本上我想要它做的就像是
1 * * * * python /location/of/pyfile/stream.py >
/home/hadoop/project/d2015/"currentmonth"/subfolder/"filenametimestamp".txt
引号中的所有内容都需要每小时/每月更改一次。