有哪些不同的选项,有利有弊,定期将记录添加到GAE上托管的Django应用程序中?
我目前在GAE上使用#1:django-nonrel,并在我的模型中使用custom management/django-admin commands。例如,这就是我在远程数据存储上调用自定义管理命令的方法:
manage.py remote mycommand
这个命令的优点是易于开发:我可以在本地测试管理命令,只需添加“remote”即可在GAE上使用它。
我必须使用带有cron的额外服务器进行更新。
我不知道GAE如何让用户定期运行刮刀。此外,GAE没有真正的cron - 它只是以设定的间隔点击URL。
答案 0 :(得分:1)
使用cron作业。这就是他们的设计目标。抓取是否合适取决于您正在抓取的网站上的服务条款。